Google récompense des recherches sur le langage naturel.

Par:
jean

jeu, 18/07/2013 - 11:41

Google a attribué son prix « Focused Research Award » d’une valeur de 140 000 dollars à Ivan Titov,  de  l’Université de Saarbruck, en Allemagne. Les travaux de ce chercheur  concernent les  programmes qui peuvent comprendre le langage naturel.  L'informaticien est en train d'élaborer une procédure qui permettra aux ordinateurs d'apprendre à identifier les relations sémantiques pertinentes dans les textes. Cette recherche pourrait signifier qu'à l'avenir nous pourrons poser nos questions spécifiques de l'ordinateur sur le contenu d'un texte. L'ordinateur serait alors capable d’ analyser un  texte et de fournir à l'utilisateur les bonnes réponses aux questions qu’il poserait sur ce texte.

La question que se pose le chercheur : comment les ordinateurs peuvent-ils apprendre à comprendre la signification et les relations entre les mots dans les phrases et dans les textes. «Le modèle que nous avons développé simule comment les humains créent des textes. Afin de comprendre les textes, nous faisons travailler  nos ordinateurs dans le sens inverse: en partant  du texte,  l'ordinateur va dévoiler  sa signification ou même l'intention de l'écrivain », explique le Dr Titov. Cependant, Titov et son groupe ne stipulent aucun modèle détaillé, ni de règles pré-définies.  Au lieu de cela,  ils utilisent des millions de phrases, pour générer à la fois le modèle et les règles. Les phrases qui sont analysées proviennent de grandes collections de textes, comme Wikipedia. L'analyse de cet ensemble massif de  données nécessite une grande puissance de calcul, avec des algorithmes spécialement développés, et  une centaine d'ordinateurs.

 L'idée est de développer un logiciel qui permette aux ordinateurs d'identifier les relations cachées entre les mots et les bouts de phrases, dépendantes du contexte. L'exemple de ces deux phrases le montre : «John est tout juste diplômé de l'Université de la Sarre. Il travaille maintenant pour Google ». Il est clair, même pour un ordinateur, que John et l’Université de la Sarre sont liés par la relation « est diplômé » et que John et Google sont reliés par la relation «travaille pour». Mais le modèle développé par les informaticiens de Sarrebruck peut également reconnaître que John a étudié à l'Université de la Sarre, très probablement dans le Département des sciences et de l'informatique Computer.

Une fois que les ordinateurs peuvent comprendre ces modèles du langage humain, la prochaine étape pour les chercheurs est d'appliquer la méthode pour obtenir des machines à produire automatiquement des résumés de textes significatifs et à répondre aux questions sur le contenu du texte.

 Un autre chercheur, Hans Uszkoreit , s’est vu décerné un Google Focused Award , d’une valeur de 220 000 dollars. Uszkoreit est professeur de « Computational Linguistics » à l'Université de la Sarre et directeur scientifique au Centre de recherche allemand pour l'intelligence artificielle. Il s'intéresse à la façon dont les ordinateurs peuvent identifier les relations linguistiques au sein de  grandes collections de textes.

 Les chercheurs de l'université travaillent en étroite collaboration avec le Centre allemand de recherche en intelligence artificielle et les deux instituts Max Planck d'informatique et de systèmes logiciels, qui sont situés sur le campus de Sarrebruck. Le Cluster d’excellence ‘Multimodal Computing and Interaction’ travaille sur les informations multimodales, à partir des fichiers audio, photo, image, texte et vidéo.

 Pour en savoir plus :

www.coli.uni-saarland.de
www.mmci.uni-saarland.de