Le deep learning, qu'est-ce que c'est ?

Le deep learning, qu'est-ce que c'est ?
Le deep learning, qu'est-ce que c'est ? - © aqabiz - Getty Images/iStockphoto

Le deep learning, une technologie basée sur un réseau de neurones artificiels, a révolutionné l’intelligence artificielle en l’espace de quelques années. Mais qu’est-ce que c’est au juste ?

Utilisé par Siri, Cortana et Google Now pour comprendre la voix ou être capable d’apprendre à reconnaître des visages, le deep learning (apprentissage profond en français) est souvent confondu avec le concept d’intelligence artificielle (IA). À tel point que l’on croit que ces deux mots sont des synonymes.

Pourtant, ce n’est pas du tout le cas. Le deep learning est une branche de l’IA. Explications.

Des machines surpuissantes capables de se représenter le monde

L’intelligence artificielle est née avec le développement de l’ordinateur et de l’informatique à la fin des années 1980. Différents courants ont vu le jour. L’un d’eux consistait à s’inspirer du fonctionnement du cerveau humain afin de tenter de créer des neurones artificiels. La première machine a été créée en 1951 par deux chercheurs de l’université de Harvard.

Mais ce n’est que récemment, grâce à l’avancée des performances de calcul des ordinateurs, que s’est développé le concept de deep learning. Il s’agit de réseaux de neurones disposant de nombreuses couches cachées.

Concrètement, le deep learning est une technologie qui apprend à une machine à se représenter le monde. C’est une technique d’apprentissage permettant à un programme de reconnaître le contenu d’une image ou de comprendre le langage parlé. Dans le passé, pour faire cela, les ingénieurs expliquaient à la machine comment représenter une image. Avec le deep learning, elle le fait désormais toute seule.

Des couches de neurones pour un apprentissage supervisé décuplé

Pour comprendre comment une machine parvient à cette prouesse, il faut évoquer l’apprentissage supervisé. Il s’agit d’une technique courante en IA, qui consiste à nourrir la machine de nombreuses informations. Par exemple, pour qu’un programme apprenne à reconnaître une voiture, on le "nourrit" de dizaines de milliers d’images de voitures, étiquetées comme telles. Une fois l’entraînement achevé (celui-ci peut durer des heures, voire des jours), le programme peut reconnaître des voitures sur de nouvelles images.

Le deep learning utilise lui aussi l’apprentissage supervisé mais c’est l’architecture interne de la machine qui est différente : chacune des milliers d’unités composant le réseau de neurones effectue des petits calculs simples.

Yann Ollivier, chercheur au CNRS, explique le procédé avec un exemple : "Comment reconnaître une image de chat ? Les points saillants sont les yeux et les oreilles. Comment reconnaître une oreille de chat ? L’angle est à peu près de 45 degrés. Pour reconnaître la présence d’une ligne, la première couche de neurones va comparer la différence des pixels au-dessus et en dessous : cela donnera une caractéristique de niveau 1. La deuxième couche va travailler sur ces caractéristiques et les combiner entre elles. S’il y a deux lignes qui se rencontrent à 45°, elle va commencer à reconnaître le triangle de l’oreille de chat. Et ainsi de suite". A chaque étape, le réseau de neurones approfondit sa compréhension de l’image.