Avez-vous une idée de l'empreinte carbone qui se cache derrière un algorithme de "deep learning" ?

Selon eux, les appareils destinés à entraîner un algorithme d'apprentissage approfondi peuvent entraîner une consommation d'énergie aux proportions inquiétantes d'un point de vue environnemental.

Visionner un film sur Netflix suggéré par la plateforme selon vos propres goûts, demander un service à un assistant vocal, "discuter" via le chatbot d'un site e-commerce. Tous ces processus que nous avons l'habitude de réaliser sur la toile répondent à une technologie bien connue : celles des algorithmes.


Lire aussi : Le deep learning, qu'est-ce que c'est ?


Des algorithmes toujours plus gourmands en énergie

Mais concevoir un algorithme contribue à la pollution numérique. C'est précisément cet impact écologique que des étudiants du département d'informatique de l'université de Copenhague (Danemark) ont cherché à quantifier, à partir du programme "Carbontracker".

Conçu par Lasse F. Wolff Anthony, Benjamin Kanding et le professeur assistant Raghavendra Selvan, ce logiciel permet de calculer et de prévoir la consommation d'énergie et les émissions de CO2 générés par les modèles "d'apprentissage approfondi", méthode phare de l'intelligence artificielle plus connue sous le nom anglophone "deep learning".

"En 6 ans, de 2012 à 2018, le nombre de calculs nécessaires au deep learning a augmenté de 300.000%", pointent les créateurs de Carbontracker.


Lire aussi : Quelles sont les cinq innovations technologiques des dix prochaines années ?


"L'intelligence artificielle, en particulier le sous-domaine de l'algorithme, semble susceptible de se transformer en un problème de taille pour le climat si les tendances de l'industrie se poursuivent", ajoutent-ils.

L'empreinte carbone de 126 foyers danois en une seule session

Ces derniers expliquent que les sessions d'entraînement des algorithmes impliquées dans les processus de "deep learning" se font à partir d'un matériel spécialisé et très énergivore, tournant 24 heures sur 24. "Les ensembles de données augmentent de jour en jour et les problèmes que les algorithmes doivent résoudre deviennent de plus en plus complexes", explique Benjamin Kanding.


Lire aussi : Pourquoi faut-il absolument une loi sur l'intelligence artificielle ?


L'un des plus grands algorithmes d'apprentissage approfondi développés jusqu'à présent est le modèle de langage avancé "GPT-3". D'après les fondateurs de "Carbontracker", une seule session d'entraînement pour ce modèle génère l'équivalent d'une année de consommation énergétique de 126 foyers danois et émet la même quantité de CO2 qu'un trajet de 70.000 kilomètres effectué à partir d'un véhicule à essence. "Dans quelques années, il y aura probablement plusieurs modèles qui seront beaucoup plus grands...", souligne Lasse F. Wolff Anthony.

Carbontracker, pour une puissance de calcul plus verte

C'est précisément la raison d'être du logiciel Carbontracker, programme gratuit qui fournit une base de données visant à réduire l'empreinte carbone de ces machines. "Il est possible de réduire considérablement l'impact sur le climat", assure Lasse F. Wolff Anthony.

"Par exemple, il est pertinent de former son modèle en Estonie ou en Suède, où l'empreinte carbone peut être réduite de plus de 60 fois grâce à un approvisionnement en énergie plus verte. Les algorithmes varient également beaucoup en ce qui concerne leur efficacité énergétique. Certains nécessitent moins de calculs, et donc moins d'énergie, pour obtenir des résultats similaires. Si l'on peut régler ce type de paramètres, les choses peuvent changer considérablement", estime l'étudiant.