L'encyclopédie Wikipedia sera-t-elle un jour écrite par une intelligence artificielle ?

Par:
fredericmazue

mar, 20/02/2018 - 15:13

L'équipe du projet Google Brain travaille à développer une intelligence artificielle capable d'assembler des informations pour écrire un article. Une publication sur le site de la Cornell University Library détaille le fonctionnement de cette intelligence artificielle.

Nous montrons que la génération d'articles Wikipedia en anglais peut être considérée comme une synthèse multi-documents de documents sources. Nous utilisons la synthèse extractive pour identifier grossièrement les informations saillantes et un modèle abstractif neuronal pour générer l'article. Pour le modèle abstractif, nous introduisons une architecture décodeur qui peut prendre en charge de manière très évolutive des séquences très longues. Nous montrons que ce modèle peut générer des paragraphes multi-phrases fluides et cohérents et même des articles entiers de Wikipédia écrivent les chercheurs pour présenter leurs travaux.

La capture d'écran ci-dessous montre en colonne de gauche un article rédigé par l'intelligence artificielle et en colonne de droite l'article de Wikipedia. Le résultat est assez lourd (pour ne pas dire balourd :-)

Pour rédiger un tel article l'intelligence artificielle procède en plusieurs étapes. Tout d'abord elle lance une recherche Google, puis prend les informations des 10 premiers résultats (hormis la page Wikipedia ;-) Les informations sont ensuite assemblées en un seul bloc, un seul texte. Ce texte est ensuite travaillé, classé, codé, réduit. Puis il est réécrit en prenant comme modèle la syntaxe des paragraphes des sources de données.

Evidemment tout cela a de quoi déranger. Tout d'abord, rien ne dit que les 10 résultats remontés par Google sont les résultats les plus pertinents pour rédiger un article encyclopédique. Rien ne dit non plus que les informations ainsi récoltées sont exactes. Enfin, il nous semble que le risque est grand que le travail du texte par l'IA élimine par exemple de petites informations, n'apparaissant pas dans toutes les sources, mais pourtant essentielles pour l'information et la culture de l'être humain.

Via Clubic.