{"id":7142,"date":"2021-07-29T14:36:00","date_gmt":"2021-07-29T12:36:00","guid":{"rendered":"https:\/\/numalis.com\/?p=7142"},"modified":"2025-01-14T10:43:08","modified_gmt":"2025-01-14T09:43:08","slug":"comment-lia-frugale-peut-elle-pallier-le-manque-de-donnees","status":"publish","type":"post","link":"https:\/\/numalis.com\/fr\/comment-lia-frugale-peut-elle-pallier-le-manque-de-donnees\/","title":{"rendered":"Comment l&rsquo;IA frugale peut-elle pallier le manque de donn\u00e9es ?"},"content":{"rendered":"\n<p>Comment d\u00e9velopper des syst\u00e8mes d&rsquo;IA de plus en plus complexes avec une quantit\u00e9 de donn\u00e9es plus r\u00e9duite\u2026 \u00ab Ce n&rsquo;est pas celui qui a le meilleur algorithme qui gagne, c&rsquo;est celui qui a les donn\u00e9es les plus qualitatives \u00bb.<\/p>\n\n\n\n<p>Les mots du chercheur en intelligence artificielle, Jean-Claude Heudin, illustrent le caract\u00e8re essentiel des donn\u00e9es au sein des algorithmes d\u2019IA<sup data-fn=\"e1387d2b-8198-44a5-b13b-5b6af0938a35\" class=\"fn\"><a href=\"#e1387d2b-8198-44a5-b13b-5b6af0938a35\" id=\"e1387d2b-8198-44a5-b13b-5b6af0938a35-link\">1<\/a><\/sup>. Cependant la collecte\/ production, le traitement et le stockage des donn\u00e9es sont des processus longs et co\u00fbteux. <\/p>\n\n\n\n<p>Les syst\u00e8mes de machine learning et leurs objectifs sont de plus en plus difficile \u00e0 caract\u00e9riser au fil de leur mont\u00e9e en complexit\u00e9. Le d\u00e9fis d\u2019aujourd\u2019hui est donc de concevoir des syst\u00e8mes d\u2019IA n\u00e9cessitant un volume de donn\u00e9es moins important tout en garantissant une certaine robustesse au sein du domaine d\u2019emploi envisag\u00e9. C\u2019est dans cette optique que les chercheurs et ing\u00e9nieurs travaillent \u00e0 d\u00e9velopper des intelligences artificielles dites frugales \u00e0 la fois moins gourmandes en quantit\u00e9 de donn\u00e9es et en puissance de calcul n\u00e9cessaire pour les fabriquer.<\/p>\n\n\n\n<p>L\u2019enjeu climatique est aujourd\u2019hui crucial de part l\u2019impact environnemental des data centers, on estime que la consommation \u00e9lectrique des data centers double tous les quatre ans. Et cela sans consid\u00e9rer le co\u00fbt environnemental n\u00e9cessaire pour leur fabrication. Ces derniers pourraient consommer 10 % de la production mondiale d&rsquo;\u00e9lectricit\u00e9 d&rsquo;ici 2030, contre seulement 3 % aujourd&rsquo;hui<sup data-fn=\"599e666b-508f-4b51-baf8-6fd315f61ac5\" class=\"fn\"><a href=\"#599e666b-508f-4b51-baf8-6fd315f61ac5\" id=\"599e666b-508f-4b51-baf8-6fd315f61ac5-link\">2<\/a><\/sup>. Cependant, les entreprises sont, surtout, \u00e0 la recherche d\u2019une IA frugale dans le but de pallier au manque de donn\u00e9es dont elles disposent.<\/p>\n\n\n\n<p>En effet, dans certains cas d\u2019applications il n\u2019est pas forc\u00e9ment possible d\u2019obtenir un nombre suffisant de donn\u00e9es. Nous pouvons citer par exemple le domaine militaire au sein duquel des syst\u00e8mes d\u2019IA sont, par exemple, entra\u00een\u00e9s \u00e0 reconna\u00eetre des v\u00e9hicules. Hors, pour des raisons \u00e9videntes, certaines nations ne vont pas fournir pas une base de donn\u00e9es compl\u00e8te contenant des images de leurs propres v\u00e9hicules. <\/p>\n\n\n\n<p>Mais la D\u00e9fense n\u2019est pas le seul secteur o\u00f9 le besoin en IA frugale est n\u00e9cessaire. Le domaine m\u00e9dical pourrait, \u00e0 l\u2019avenir, profiter des capacit\u00e9s de m\u00e9decine personnalis\u00e9e \u00e0 chaque patient. En effet, chaque maladie et patient \u00e9tant uniques, un algorithme s\u2019adaptant \u00e0 chaque patient pourrait l\u2019aider \u00e0 mieux g\u00e9rer sa douleur ou sa r\u00e9cup\u00e9ration. Ici l\u2019apprentissage frugal est indispensable car le syst\u00e8me n\u2019apprend qu\u2019\u00e0 partir d\u2019une seule source de donn\u00e9es : le patient lui-m\u00eame.<\/p>\n\n\n\n<p>L\u2019IA frugale n\u2019en est encore qu\u2019\u00e0 ses d\u00e9buts et est aujourd\u2019hui un champ de recherche actif. Il est, aujourd\u2019hui encore, difficile d&rsquo;entra\u00eener un mod\u00e8le \u00e0 partir d\u2019un nombre de donn\u00e9es relativement r\u00e9duit, voire d\u2019une unique instance (one shot learning). Cependant il existe des m\u00e9thodes pour pallier ou contourner ce manque de donn\u00e9es.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Apprentissage par transfert<\/h2>\n\n\n\n<p>Cette m\u00e9thode consiste \u00e0 r\u00e9utiliser un syst\u00e8me d\u2019IA existant ayant commenc\u00e9 \u00e0 apprendre \u00e0 partir d\u2019un dataset suffisant. L\u2019id\u00e9e est de partir d\u2019une IA ayant appris \u00e0 partir de donn\u00e9es un peu similaires \u00e0 celles qui manquent. <\/p>\n\n\n\n<p>L\u2019objectif par exemple n\u2019est plus d\u2019identifier des voitures mais des v\u00e9hicules blind\u00e9s. Dans un premier temps le syst\u00e8me d\u2019IA est entrain\u00e9 \u00e0 reconna\u00eetre des voitures, mais sans pour autant \u00eatre tr\u00e8s performant. Le but est de lui faire apprendre \u00e0 reconna\u00eetre seulement des caract\u00e9ristiques qui seront communes ou relativement proches de celles que le syst\u00e8me final aura \u00e0 apprendre. Les data scientistes r\u00e9alisent l&rsquo;apprentissage du second syst\u00e8me en y injectant les donn\u00e9es du premier puis en compl\u00e9tant son apprentissage en s\u2019appuyant sur les quelques donn\u00e9es dont ils disposent.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">G\u00e9n\u00e9ration et enrichissement des donn\u00e9es<\/h2>\n\n\n\n<p>La g\u00e9n\u00e9ration de donn\u00e9es consiste \u00e0 utiliser un environnement virtuel pour g\u00e9n\u00e9rer le plus fid\u00e8lement possible les conditions d\u2019un environnement r\u00e9el. L\u2019objectif est de g\u00e9n\u00e9rer les donn\u00e9es qui manquent pour l&rsquo;entra\u00eenement directement \u00e0 partir de cet environnement de simulation. <\/p>\n\n\n\n<p>Ainsi, revenons \u00e0 notre exemple de syst\u00e8me d\u2019IA visant \u00e0 reconna\u00eetre un v\u00e9hicule blind\u00e9. Certaines entreprises sp\u00e9cialis\u00e9es vont construire une reproduction fid\u00e8le du v\u00e9hicule en 3D pour ensuite g\u00e9n\u00e9rer les images du v\u00e9hicule dans les sc\u00e9narios appropri\u00e9s. Dans l\u2019id\u00e9e, il devient alors possible d\u2019obtenir une quantit\u00e9 presque infinie de donn\u00e9es contenant des images de l&rsquo;objet \u00e0 d\u00e9tecter et ce dans de multiples sc\u00e9narios. Le d\u00e9fi principal de cette approche est le passage en condition r\u00e9elle, o\u00f9 les performances du syst\u00e8me ne se maintiennent pas forc\u00e9ment. <\/p>\n\n\n\n<p>D\u2019une part car il est difficile de reproduire de mani\u00e8re totalement r\u00e9aliste un environnement r\u00e9el. D\u2019autre part car il existe un risque que l\u2019IA apprennent plus les biais de la mod\u00e9lisation que l\u2019objet mod\u00e9lis\u00e9. A d\u00e9faut de g\u00e9n\u00e9rer ex nihilo les donn\u00e9es, il \u00e9galement possible de g\u00e9n\u00e9rer de nouvelles donn\u00e9es \u00e0 partir de donn\u00e9es existantes avec des techniques d\u2019augmentation de donn\u00e9es. <\/p>\n\n\n\n<p>Pour ce faire, cette technique d\u00e9cline en perturbant un dataset existant (rotation, ajout de flou, d\u00e9gradation d\u2019image). Il est possible par ailleurs, de lier g\u00e9n\u00e9ration de donn\u00e9es et augmentation de ces derni\u00e8res afin de rendre un dataset plus complet. Cependant, l\u2019augmentation de donn\u00e9es n\u2019est pas une solution miracle. En effet, elle ne permet pas d\u2019\u00e9tendre le domaine d\u2019emploi d\u2019un syst\u00e8me d\u2019IA,mais de seulement renforcer sa robustesse dans un environnement d\u00e9j\u00e0 couvert.<\/p>\n\n\n\n<p>L\u2019IA frugale semble avoir de beaux jours devant elle de par la politique volontariste de l\u2019Europe qu\u2019elle suscite. \u00c0 travers plusieurs projets Horizon Europe et EDIDP, les 27 cherchent \u00e0 r\u00e9duire l\u2019empreinte num\u00e9rique des IA mais aussi de mani\u00e8re indirecte \u00e0 augmenter son ind\u00e9pendance et sa souverainet\u00e9 num\u00e9rique face aux GAFA et aux BATX<sup data-fn=\"e6ccd24c-0739-4a69-acf1-346af7820afc\" class=\"fn\"><a href=\"#e6ccd24c-0739-4a69-acf1-346af7820afc\" id=\"e6ccd24c-0739-4a69-acf1-346af7820afc-link\">3<\/a><\/sup>.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Sources<\/h2>\n\n\n<ol class=\"wp-block-footnotes\"><li id=\"e1387d2b-8198-44a5-b13b-5b6af0938a35\"><a href=\"https:\/\/hellofuture.orange.com\/en\/towards-a-less-data-and-energy-intensive-ai\/\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">Frugal AI: less data and energy intensive algorithms<\/a> <a href=\"#e1387d2b-8198-44a5-b13b-5b6af0938a35-link\" aria-label=\"Aller \u00e0 la note de bas de page 1\">\u21a9\ufe0e<\/a><\/li><li id=\"599e666b-508f-4b51-baf8-6fd315f61ac5\"><a href=\"https:\/\/www.lebigdata.fr\/data-center-impact-environnement\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">Data center : l&rsquo;impact des infrastructures sur l&rsquo;environnement et les solutions possibles<\/a> <a href=\"#599e666b-508f-4b51-baf8-6fd315f61ac5-link\" aria-label=\"Aller \u00e0 la note de bas de page 2\">\u21a9\ufe0e<\/a><\/li><li id=\"e6ccd24c-0739-4a69-acf1-346af7820afc\"><a href=\"https:\/\/www.inria.fr\/fr\/enjeux-environnement-empreinte-numerique-sobriete\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">Frugalit\u00e9 : r\u00e9duire notre empreinte num\u00e9rique | Inria<\/a> <a href=\"#e6ccd24c-0739-4a69-acf1-346af7820afc-link\" aria-label=\"Aller \u00e0 la note de bas de page 3\">\u21a9\ufe0e<\/a><\/li><\/ol>","protected":false},"excerpt":{"rendered":"<p>Comment d\u00e9velopper des syst\u00e8mes d&rsquo;IA de plus en plus complexes avec une quantit\u00e9 de donn\u00e9es plus r\u00e9duite\u2026 \u00ab Ce n&rsquo;est pas celui qui a le meilleur algorithme qui gagne, c&rsquo;est celui qui a les donn\u00e9es les plus qualitatives \u00bb. Les mots du chercheur en intelligence artificielle, Jean-Claude Heudin, illustrent le caract\u00e8re essentiel des donn\u00e9es au [&hellip;]<\/p>\n","protected":false},"author":8,"featured_media":7147,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"_seopress_robots_primary_cat":"none","_seopress_titles_title":"","_seopress_titles_desc":"","_seopress_robots_index":"","footnotes":"[{\"content\":\"<a href=\\\"https:\/\/hellofuture.orange.com\/en\/towards-a-less-data-and-energy-intensive-ai\/\\\" target=\\\"_blank\\\" rel=\\\"noreferrer noopener nofollow\\\">Frugal AI: less data and energy intensive algorithms<\/a>\",\"id\":\"e1387d2b-8198-44a5-b13b-5b6af0938a35\"},{\"content\":\"<a href=\\\"https:\/\/www.lebigdata.fr\/data-center-impact-environnement\\\" target=\\\"_blank\\\" rel=\\\"noreferrer noopener nofollow\\\">Data center : l'impact des infrastructures sur l'environnement et les solutions possibles<\/a>\",\"id\":\"599e666b-508f-4b51-baf8-6fd315f61ac5\"},{\"content\":\"<a href=\\\"https:\/\/www.inria.fr\/fr\/enjeux-environnement-empreinte-numerique-sobriete\\\" target=\\\"_blank\\\" rel=\\\"noreferrer noopener nofollow\\\">Frugalit\u00e9 : r\u00e9duire notre empreinte num\u00e9rique | Inria<\/a>\",\"id\":\"e6ccd24c-0739-4a69-acf1-346af7820afc\"}]"},"categories":[152],"tags":[186],"class_list":["post-7142","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-ia-technique","tag-semantique"],"acf":[],"_links":{"self":[{"href":"https:\/\/numalis.com\/fr\/wp-json\/wp\/v2\/posts\/7142","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/numalis.com\/fr\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/numalis.com\/fr\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/numalis.com\/fr\/wp-json\/wp\/v2\/users\/8"}],"replies":[{"embeddable":true,"href":"https:\/\/numalis.com\/fr\/wp-json\/wp\/v2\/comments?post=7142"}],"version-history":[{"count":0,"href":"https:\/\/numalis.com\/fr\/wp-json\/wp\/v2\/posts\/7142\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/numalis.com\/fr\/wp-json\/wp\/v2\/media\/7147"}],"wp:attachment":[{"href":"https:\/\/numalis.com\/fr\/wp-json\/wp\/v2\/media?parent=7142"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/numalis.com\/fr\/wp-json\/wp\/v2\/categories?post=7142"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/numalis.com\/fr\/wp-json\/wp\/v2\/tags?post=7142"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}