Cette thèse explore deux questions de recherche situées dans le paradigme constructionniste basé sur les usages. D’une part, nous proposons de caractériser le contenu sémantique des constructions en intégrant les représentations vectorielles propre des modelés distributionnels aux descriptions linguistiques des Grammaires de Construction.
Nous abordons en plus une question encore ouverte: Quels principes cognitifs et linguistiques régissent la compréhension du langage? De nombreux travaux suggèrent que l’interprétation des phrases alterne entre stratégies compositionnelles et non-compositionnelles. Bien qu’il soit reconnu que les idiomes sont lus très rapidement, nous avançons que les expressions littérales, si suffisamment fréquentes, sont traitées de la même manière. Grâce au paradigme du Self-Paced Reading, nous avons testé les temps de lecture de phrases idiomatiques, littérales très fréquentes et littérales peu fréquentes: les effets de facilitation se produisent également lors du traitement de phrases fréquentes et composées.
D’ailleurs, nous soutenons que plusieurs processus systématiques de productivité du langage sont explicables par des inférences analogiques: les phrases nouvelles sont produites et comprises “à la volée” par analogie avec des expressions familières. Nous présentons ANNE, un réseau neuronal qui simule la construction de nouvel vecteurs de phrases comme un processus analogue. Cet système a été évalué sur sa capacité à généraliser à partir de vecteurs existants.
Cette thèse représente une contribution à la clarification de la littérature complexe sur la compréhension du langage et à l’ouverture de nouvelles études expérimentales et computationnels.