Amphithéâtre Marguerite de Navarre, Site Marcelin Berthelot
En libre accès, dans la limite des places disponibles
-

Dans un article important, Fei Xu et Joshua Tenenbaum proposent une théorie bayésienne de l’acquisition du sens des mots (Xu & Tenenbaum, 2007). Leur modèle suppose que l’enfant dispose d’un vaste espace d’hypothèses sur les référents possibles des mots. Chaque hypothèse consiste en un sous-ensemble d’objets auquel un mot peut renvoyer (par exemple : « tous les êtres vivants », « tous les chiens », « tous les dalmatiens », etc.). Chaque fois que l’enfant entend un mot dans un contexte donné, il met à jour la probabilité que chaque hypothèse soit vraie, en suivant les règles bayésiennes. Enfin, une hypothèse cruciale du modèle est que la vraisemblance varie en fonction inverse de la taille de l’hypothèse considérée.

À partir de ces axiomes, les auteurs montrent qu’il est possible de rendre compte d’une série d’observations empiriques importantes. Le sens d’un mot peut être appris à partir d’un seul exemple, ou de quelques-uns. Les exemples positifs suffisent : l’enfant n’a pas besoin de contre-exemples. Il peut acquérir un ensemble de mots pour des concepts qui se recouvrent. Les inférences sur le sens d’un mot sont graduelles, avec des degrés de confiance variables. Enfin, ces inférences peuvent être influencées par le contexte d’apprentissage, particulièrement l’attention, les connaissances et les intentions du locuteur.

En particulier, le modèle bayésien rend compte, sans hypothèse supplémentaire, d’un principe linguistique classique, le principe d’exclusivité : chaque entité ne possède qu’un seul nom. Dès seize mois, en effet, lorsqu’ils entendent un nom nouveau, les enfants postulent que celui-ci renvoie à un objet dont ils ne connaissent pas déjà le nom. Cette propriété découle simplement d’un modèle bayésien hiérarchique, si l’on suppose l’enfant capable d’inférences conversationnelles telles que « si mon interlocuteur avait voulu nommer l’objet X, il aurait utilisé le mot X ». Ainsi, l’acquisition du lexique ne nécessite peut-être rien d’autre qu’un algorithme générique d’inférence statistique qui pourrait être présent chez d’autres espèces animales. De fait, l’apprentissage de plusieurs centaines de mots, en respectant le principe d’exclusivité, a été documenté chez un chien domestique.