1200 pages. C’est ce qu’il a fallu à Tanguy Solliec pour exposer ses travaux de thèse sur les aires de répartition des différentes formes linguistiques du breton. Frontières géographiques naturelles, démographie, génétique… il a exploré toutes les hypothèses.
Rencontre avec Tanguy Solliec pour découvrir les coulisses de la linguistique et de la langue bretonne.
Un travail entamé en 1910
Comme beaucoup de langues, le breton n’est pas homogène et la prononciation des mots varie selon le lieu. Si la base est commune, il existe une grande variété dans la prononciation de certains mots. Par exemple, laezh (lait), se prononce (leːs) -lés- dans la région de Carhaix, mais (ˈleas) dans le nord Finistère.
Cette diversité linguistique est retranscrite sur des cartes thématiques montrant la distribution géographique des locuteurs d'une langue, l’ensemble de ces cartes linguistiques forme des atlas linguistiques. L’Atlas Linguistique de la Basse-Bretagne (ALBB) a été réalisé par Pierre Le Roux entre 1910 et 1920. Une première analyse scientifique de cette base de données avait été réalisée par François Falc’hun, l’un des fondateurs du Collège universitaire de Brest. Cette analyse dans les années 50, a permis de renouveler la compréhension de l’organisation dialectale du breton et son histoire.
Le Nouvel Atlas Linguistique de la Basse-Bretagne (NALBB) vient prolonger et renouveler les travaux menés sur la linguistique bretonne. Cet atlas est le résultat d’un travail de terrain mené entre 1969 et 1999 par Jean Le Dû dans 187 communes de basse Bretagne (du Finistère à la partie occidentale des Côtes-d’Armor et du Morbihan). Dans chaque commune, les enquêteurs ont rapporté la prononciation phonétique d’une série de mots, aboutissant à plus de 600 cartes linguistiques. L’analyse de cette « mer de données », comme l’appelle Tanguy Solliec, nécessite encore un immense travail de recherche scientifique.
Ancien professeur des écoles, Tanguy Solliec a réalisé sa thèse en linguistique entre 2014 et 2021 au sein du Centre de recherche bretonne et celtique (CRBC) : « Les données récoltées dans l’atlas sont extrêmement variées, il faut essayer de les comprendre pour leur donner un sens en linguistique ». Et c’était là, l’objectif de sa thèse.
Des mathématiques appliquées à la linguistique
Les analyses des données de l’ALBB par François Falc’hun avaient permis de délimiter plusieurs aires linguistiques pour la langue bretonne :
- une zone centrale « innovatrice » autour de Carhaix, ancien centre du réseau de voies romaines en Armorique qui a pu faciliter la dissémination des innovations linguistiques (nouveau mot, changement de prononciation…) le long des routes ;
- et deux zones périphériques au Nord-Ouest et au Sud-Est.
Ces conclusions remettaient en cause une idée plus ancienne qu’il existait un dialecte breton pour chaque ancien évêché. Ces évêchés structuraient géographiquement et politiquement la Bretagne avant la Révolution française.
Grâce aux données phonétiques (la prononciation), à la géolocalisation ou aux informations grammaticales et lexicales issues du NALBB, Tanguy Solliec a pu mettre à jour ces résultats. Des analyses statistiques ont permis de quantifier les différentes prononciations dans l’espace, c’est ce qu’on appelle la distance linguistique. Cette distance est identifiable par tous, notamment dans les accents, qui trahissent les différentes formes orales d’une langue selon le territoire d’origine du locuteur. Mais les outils d’analyse, ou dialectométrie, permettent de les interpréter scientifiquement afin d’en comprendre les origines et les faits qui produisent ces différences.
En utilisant un algorithme qui se base sur la distance de Levenstein, Tanguy Solliec a pu calculer le pourcentage de similarité entre deux prononciations d’un même mot à travers le domaine bretonnant.
© Tanguy Solliec – Exemple avec le mot « (de l’) herbe » entre Collorec et Botmeur
Les résultats obtenus sont reportés sur des cartes de distribution spatiale qui permettent ainsi de cartographier des aires linguistiques. Les premières analyses obtenues par la dialectométrie ne permettaient pas de distinguer fermement ces trois zones. La suite des travaux de Tanguy Solliec consistait alors à comprendre leurs origines et les causes de cette faible démarcation. De plus, certains phénomènes semblaient favoriser l’interprétation ancienne d’un dialecte par « évêché ».
Plusieurs hypothèses sont alors avancées pour mieux comprendre la répartition de la distance linguistique au sein du domaine bretonnant.
© Tanguy Solliec – Similarité phonétique en Basse-Bretagne
Une maladie génétique reflète la distribution de la distance linguistique ?
Pour sa première hypothèse Tanguy Solliec a alors cherché à évaluer si des facteurs géographiques interviennent dans la distribution de la distance linguistique. Ces facteurs peuvent parfois être pertinents à une échelle locale, mais sont plus limités à l’échelle de la région : les aires linguistiques ne suivent ni les frontières des évêchés qui structuraient la Bretagne, ni les frontières naturelles formées par les rivières, les massifs forestiers ou le relief.
Étonnamment, on observe des correspondances au niveau géographique avec la répartition du gène CFTR, responsable de la mutation génétique à l’origine de la mucovisicidose. Cette maladie génétique est particulièrement présente en Bretagne et principalement dans le Finistère. Pour comprendre ce phénomène, Tanguy Solliec s’est associé à Nadine Pellen. En tant que socio-démographe, elle a mené une enquête généalogique pour comprendre comment le gène CFTR se transmettait dans les familles bretonnes. C’est un phénomène complexe, faisant intervenir critères sociaux et facteurs biologiques. Mais la génétique des populations a permis de montrer qu’en Bretagne, il y a eu peu de mouvement migratoire important à des périodes ultérieures et qui auraient permis de renouveler le patrimoine génétique de la population. C’est ce qui peut expliquer la forte concentration de cette mutation, qui se transmet de génération en génération dans certaines zones géographiques assez bien délimitées.
Bien qu’on observe des similarités dans la distribution géographique des différentes mutations du gène CFTR et les observations linguistiques, il n’y a pas de lien de cause à effet entre les deux, mais une corrélation. C’est seulement un marqueur commun que l’on peut explorer pour comprendre le passé de la Bretagne.
Ainsi, la géographie de la Bretagne ne permet pas de comprendre la distribution spatiale des dialectes, mais la génétique des populations aide à penser comment la distance linguistique est structurée. Une autre hyptohèse tant alors à se dégager : le temps !
Aux origines du breton
L’histoire linguistique de la pointe armoricaine est difficile à retracer car les sources archéologiques et historiques sont rares. Mais elle est certainement liée à des phénomènes de migrations entre les Ve et VIIe siècles, au moment où la pointe armoricaine prend le nom de Bretagne. On observe alors des arrivées par voies maritimes. Même si peu d’archives documentent ce phénomène, on observe un avant et un après, par exemple dans les noms de lieux. C’est sans doute à cette période que les dialectes brittoniques, le stade antérieur au breton, se sont mêlés à des variétés de latin tardif , ou peut-être même de gaulois tardifs faisant évoluer la langue. Les migrations ont donc pu avoir des effets à la fois sur la démographie de la Bretagne, mais également sur le paysage linguistique.
Les mouvements de population n’ont pas été homogènes sur le territoire : le Nord-Ouest est alors sans doute moins peuplé et plus rural, alors que le Sud-Ouest serait plus densément habité et urbanisé. Ces différences d’occupation du territoire ont pu contribuer à différencier deux grandes aires linguistiques identifiées par Tanguy Solliec. Cette opposition se retrouve aussi dans la distribution des mutations du gène responsable de la mucoviscidose.
On observe un effet fondateur, phénomène bien connu des généticiens, qui peut s’appliquer à la linguistique : deux populations se distinguent suite à l’apparition de caractéristiques propres qui se diffusent dans l’une d’entre elles.
« Au début, j’étais un peu perdu face aux résultats, qui étaient complètement inattendus. Et puis, à partir du moment où j'ai trouvé une piste, les différentes briques se sont assemblées tout de suite, presque spontanément. C’est là que j’ai vu comment une langue se construit. »
Ainsi, en partant des données du NALBB de Jean Le Dû recueillies à l’époque contemporaine, Tanguy Solliec a pu observer l’émergence d’une langue et retracer son histoire. Il montre que les origines d’une langue peuvent être étudiées quand bien même les sources écrites anciennes seraient limitées ou inexistantes. Un travail qu’il espère pouvoir appliquer à d’autres langues.
Des travaux récompensés
Chaque année depuis 2010, la Societas Celtologica Europaea, société savante européenne, remet le prix Johann-Kaspar-Zeuß qui désigne la meilleure thèse sur l’étude des langues celtiques.
En septembre 2022, c’est la thèse de Tanguy Solliec, à la croisée entre linguistique, statistique, histoire et génétique, qui a été distinguée. C’est la première fois depuis la création du prix que des travaux sur la langue bretonne sont récompensés.
« Le breton fait figure de parent pauvre au sein des études celtiques. La langue bretonne est avant tout étudiée par des chercheurs francophones, et les autres langues celtiques par des chercheurs anglophones, il y a une sorte de fossé linguistique et les ponts entre ces deux sphères ne sont pas nombreux. Le breton n’est donc pas bien connu des chercheurs anglophones, même si la situation va en s’améliorant. C’est pour ça que c'est intéressant de remettre ce prix à des travaux rédigés en français sur le breton.
C’est aussi une reconnaissance de mes analyses, elles sont valides. Cela permet aussi de faire connaître ce travail et de faire parler du breton, de montrer que c'est une langue qui peut apporter des perspectives sur la linguistique et montrer des résultats intéressants qui contribuent à la science en général. »
Pour aller plus loin :