Quand les ordinateurs apprennent à parler

D'Alexa à Siri, du programme de traduction aux actualités générées par ordinateur, tout semble aujourd'hui réalisable. Au Media Technology Center, on cherche des applications pour le quotidien des rédactions.

16.09.2020 de Martina M?rki

Illustration de la bulle — (Illustration : Ray Oranges)

Chaque fois que nous posons des questions ou donnons des ordres à notre smartphone via Siri ou un programme similaire, nous communiquons avec une intelligence artificielle. Seulement, cette intelligence est limitée. Comparé à l'intelligence humaine, Siri est même plut?t stupide, estime Ryan Cotterell, professeur à l'ETH Zurich depuis février 2020. Ce professeur d'informatique a été nommé dans le cadre de l'initiative sur les technologies des médias et combine la linguistique, le traitement automatisé du langage et l'intelligence artificielle. "Si Siri fonctionne, c'est parce que les questions et les commandes que les gens posent à leur smartphone sont généralement très simples", explique Cotterell.

Il ne faut pas attendre de l'IA la même chose que de l'intelligence humaine, souligne le chercheur. Chaque être humain apprend sans peine sa langue maternelle, et chaque germanophone reconna?t intuitivement les phrases grammaticalement incorrectes en allemand. Mais pour un programme informatique, il est toujours difficile de savoir si une phrase allemande est grammaticalement correcte. Un programme de traitement linguistique fonctionne également très différemment d'un cerveau humain : "Aucun traducteur n'a jamais d? apprendre autant de mots qu'il n'en faut pour entra?ner un programme de traduction", explique Cotterell.

Le défi du suisse-allemand

Les programmes de traduction modernes travaillent dans le domaine des big data. Ils s'entra?nent avec des millions de paires de phrases. Pourtant, chaque traducteur peut facilement proposer plusieurs alternatives pour une phrase traduite. Les programmes de traduction ne proposent qu'une seule solution. Cotterell souhaite changer cela. "Nous souhaitons que l'utilisateur ne re?oive pas qu'une seule phrase comme résultat, mais plusieurs possibilités. L'utilisateur pourrait alors choisir la phrase qui convient le mieux au contexte spécifique", mais développer un algorithme utilisable pour cela est compliqué. Les bons programmes de traduction ou les assistants vocaux pour les langues qui ne sont utilisées que par de petits groupes constituent également un problème. "S'il n'y a pas autant de données dans une langue, il est très difficile de développer un bon système", explique Cotterell. Il est impressionné par un programme développé au Media Technology Center de l'ETH Zurich - un assistant vocal qui parle les dialectes suisses.

C'est une t?che exigeante, non seulement parce qu'il existe de nombreuses variantes régionales, mais aussi parce que les dialectes suisses sont des langues parlées sans orthographe standardisée. Depuis 2019, l'assistant vocal parle couramment le "B?rndütsch". L'objectif est de l'étendre à d'autres dialectes. Les chercheurs développent l'assistant suisse-allemand avec la Radio Télévision Suisse comme partenaire. Les technologies capables de traduire le haut allemand en suisse allemand ou de prononcer les nouvelles locales et les prévisions météorologiques en dialecte pourraient également conférer une authenticité régionale aux textes prononcés automatiquement.

Monde des médias générés par ordinateur

La diversité linguistique de la Suisse et de l'Europe crée un besoin de recherche. En effet, les systèmes de traitement des langues, y compris ceux qui sont adaptés à l'utilisation dans les médias, proviennent généralement de l'espace anglophone. "C'est pourquoi ce que les médias américains ou anglais montrent en matière de traitement informatisé des langues ne peut pas être simplement appliqué ici", explique Cotterell. Il prévoit ainsi, avec le soutien de la NZZ et de TX Group, un système de traduction qui permettrait de traduire des articles de qualité de l'allemand vers le fran?ais. Severin Klingler, directeur du Media Technology Center, explique : "Nous souhaitons rendre disponibles pour d'autres langues des technologies qui existent pour l'anglais".

Le nouveau monde des médias crée ses propres défis. Les bulles de filtrage et les fake news font désormais partie du quotidien des médias. Peut-on y remédier avec l'IA ? Le Media Technology Center se penche également sur cette question. Dans le cadre d'un projet, il s'agit de contrer la bulle de filtre en faisant en sorte que le système recherche des contenus avec des contre-arguments sur un sujet : Anti-recommendation Engine for News Articles", tel est le nom du projet. Un autre projet vise à trier mécaniquement les commentaires selon des critères de contenu. "On pourrait ainsi rendre plus visible la diversité des opinions", espère Klingler.

Toutefois : les mêmes méthodes peuvent également être utilisées pour créer des bulles de filtrage et des fausses nouvelles. Au début de l'été, un nouveau système d'IA traitant les langues, appelé GPT3 et développé par la société californienne OpenAI, a fait les gros titres. "Les dimensions de ce système sont si grandes que nous ne pouvons ni construire ni tester quelque chose de ce genre dans les hautes écoles", explique Cotterell. Le système a fait les gros titres notamment en raison du risque de fausses nouvelles générées par l'IA : GPT3 écrit en anglais des textes de nouvelles qui semblent crédibles après quelques exemples de nouvelles. Ryan Cotterell et ses co-chercheurs du Media Technology Center ont encore beaucoup de travail devant eux.

Promouvoir une place médiatique suisse innovante

Ryan Cotterell fait partie des "Academia Experts" du Media Technology Center de l'ETH Zurich. La chaire et le centre sont soutenus par les entreprises de médias Ringier, TX Group, SRG SSR et NZZ, ainsi que par l'association Médias suisses et d'autres partenaires.

page externewww.ethz-foundation.ch/medientechnologie

Ce texte est paru dans le dernier numéro de l'ETH Magazine. Globe est paru.