Reconnaître les langues
Posted: 14 Aug 2008 14:11
Bonjour, je sais que ce forum est plein de spécialistes alors je m'adresse à vous. En ce moment j'essaie d'apprendre à reconnaître à l'écrit les langues d'Europe (officielles le plus souvent mais aussi quelques autres) et quelques autres langues indo-européennes. Ça n'a pas un grand intérêt mais c'est assez intéressant. Bien sûr j'essaie d'abord de repérer les lettres, diacritiques et autres signes typographiques qui ne se retrouvent que dans une seule ou un nombre limité de langues. Dans le meilleur des cas c'est un alphabet entier qui est exclusif d'une langue, comme le géorgien, l'arménien ou le grec moderne qu'on reconnaît au 1er coup d'oeil (sans tenir compte des éventuels dialectes ou variantes dans ces langues). Dans d'autres langues il y a des lettres qui ne trompent pas, j'ai fait une liste des lettres exclusives et des particularités, corrigez-moi, je me trompe sûrement pour certaines :
- islandais : la combinaison ð + æ + þ
- suédois : présence du å mais différent du danois et norvégien par les ö et ä
- danois et norvégien : å + æ + ø. Le problème est de différencier les deux langues (je ne parle même pas de différencier le bokmal du nynorsk, j'ai du mal), je pense que la combinaison "sj" est caractéristique du norvégien (surtout bokmal j'ai l'impression, mais je n'y connais rien donc j'attend les confirmations des spécialistes).
- estonien : le õ me semble exclusif de cette langue
- bulgare : le ъ, le bulgare ne pose pas trop de problème
- macédonien : l'alphabet cyrillique + le j + le ѓ
- ukrainien : cyrillique + ï et i
- biélorusse : cyrillique + ў ? (les doubles нн sont fréquents aussi)
- serbe en cyrillique : љ + ћ +ђ ...
- croate : alphabet latin + đ (les différences serbe en alphabet latin/croate/bosniaque etc. sont trop subtiles, d'autant que ce sont des langues ausbau comme disent les spécialistes)
- slovène : lui je le reconnais à 100 m, je ne sais pas pourquoi (les hatcheks plus rares que les autres langues slaves ? pas vraiment de diacritiques sur les voyelles comme en tchèque ou slovaque ?)
- tchèque : le plus dur est de le différencier du slovaque, généralement j'y arrive. J'ai l'impression qu'il n'y a pas de ě en slovaque alors qu'il est fréquent en tchèque.
- slovaque : les terminaisons en -om qui doivent marquer une déclinaison alors que le tchèque montre plus souvent des -em
- polonais : là aussi repérable de loin, les ł, les ą, les points suscrits, les combinaisons szcz etc. Je pense pas qu'il y ait trop de risque de confondre avec le cachoube qui est plus particulier.
- letton : macron très fréquent sur toutes les voyelles, hatcheks, cédilles, terminaisons fréquentes en -as
-lituanien : macron uniquement sur le u, point suscrit...
- différence corse/sarde/sicilien : je veux bien des conseils pour différencier ces 3 langues
- albanais : les ë très fréquents (pour la différence guègue/tosque, eventuellement la fréquence des rhotacismes plus importantes en tosque)
- azéri : alphabet cyrillique ou latin + présence du schwa ә + ғ en cyrillique (assez rare quand même)
- kazakh : le schwa aussi + i + Y rayé
- hongrois : le ő assez fréquent est un bon indice + combinaisons de consones "sz", fréquence du y et des accents aigus sur les voyelles
- basque : facile à repérer
- différence portugais/galicien : le galicien normalisé utilise plutôt le ñ que le nh portugais si j'ai bien compris, je ne vois pas de j dans le galicien écrit
- catalan (plusieurs variétés mais les normes sont plus ou moins les mêmes) : tirets fréquents sur l'enclise, terminaisons en -eu et en -t...
- roumain : facile à répérer par les différents signes et accents
- maltais : idem
Bon, voilà pour les principales langues, j'aurais pu continuer mais mon message est déjà assez long, je pense... Vous allez peut-être vous demander l'intérêt de tout ça, je précise que c'est par simple intérêt pour les langues
. N'hésitez pas à me corriger et à faire des précisions sur les langues que vous connaissez, et à donner tous les indices possibles pour indentifier une langue. vous pouvez même parler de langues qui ne figures pas dans liste (par exemple les parlers germaniques, tellement nombreux que je n'ose même pas essayer de les différencier, entre toutes les variétés de romanches, d'alémanique etc.). Merci si vous participez au sujet 
- islandais : la combinaison ð + æ + þ
- suédois : présence du å mais différent du danois et norvégien par les ö et ä
- danois et norvégien : å + æ + ø. Le problème est de différencier les deux langues (je ne parle même pas de différencier le bokmal du nynorsk, j'ai du mal), je pense que la combinaison "sj" est caractéristique du norvégien (surtout bokmal j'ai l'impression, mais je n'y connais rien donc j'attend les confirmations des spécialistes).
- estonien : le õ me semble exclusif de cette langue
- bulgare : le ъ, le bulgare ne pose pas trop de problème
- macédonien : l'alphabet cyrillique + le j + le ѓ
- ukrainien : cyrillique + ï et i
- biélorusse : cyrillique + ў ? (les doubles нн sont fréquents aussi)
- serbe en cyrillique : љ + ћ +ђ ...
- croate : alphabet latin + đ (les différences serbe en alphabet latin/croate/bosniaque etc. sont trop subtiles, d'autant que ce sont des langues ausbau comme disent les spécialistes)
- slovène : lui je le reconnais à 100 m, je ne sais pas pourquoi (les hatcheks plus rares que les autres langues slaves ? pas vraiment de diacritiques sur les voyelles comme en tchèque ou slovaque ?)
- tchèque : le plus dur est de le différencier du slovaque, généralement j'y arrive. J'ai l'impression qu'il n'y a pas de ě en slovaque alors qu'il est fréquent en tchèque.
- slovaque : les terminaisons en -om qui doivent marquer une déclinaison alors que le tchèque montre plus souvent des -em
- polonais : là aussi repérable de loin, les ł, les ą, les points suscrits, les combinaisons szcz etc. Je pense pas qu'il y ait trop de risque de confondre avec le cachoube qui est plus particulier.
- letton : macron très fréquent sur toutes les voyelles, hatcheks, cédilles, terminaisons fréquentes en -as
-lituanien : macron uniquement sur le u, point suscrit...
- différence corse/sarde/sicilien : je veux bien des conseils pour différencier ces 3 langues

- albanais : les ë très fréquents (pour la différence guègue/tosque, eventuellement la fréquence des rhotacismes plus importantes en tosque)
- azéri : alphabet cyrillique ou latin + présence du schwa ә + ғ en cyrillique (assez rare quand même)
- kazakh : le schwa aussi + i + Y rayé
- hongrois : le ő assez fréquent est un bon indice + combinaisons de consones "sz", fréquence du y et des accents aigus sur les voyelles
- basque : facile à repérer

- différence portugais/galicien : le galicien normalisé utilise plutôt le ñ que le nh portugais si j'ai bien compris, je ne vois pas de j dans le galicien écrit
- catalan (plusieurs variétés mais les normes sont plus ou moins les mêmes) : tirets fréquents sur l'enclise, terminaisons en -eu et en -t...
- roumain : facile à répérer par les différents signes et accents
- maltais : idem

Bon, voilà pour les principales langues, j'aurais pu continuer mais mon message est déjà assez long, je pense... Vous allez peut-être vous demander l'intérêt de tout ça, je précise que c'est par simple intérêt pour les langues

