{"id":7150,"date":"2021-06-08T11:24:00","date_gmt":"2021-06-08T09:24:00","guid":{"rendered":"https:\/\/numalis.com\/?p=7150"},"modified":"2025-01-14T14:24:06","modified_gmt":"2025-01-14T13:24:06","slug":"le-manque-de-robustesse-une-fatalite-pour-les-systemes-dia","status":"publish","type":"post","link":"https:\/\/numalis.com\/fr\/le-manque-de-robustesse-une-fatalite-pour-les-systemes-dia\/","title":{"rendered":"Le manque de robustesse, une fatalit\u00e9 pour les syst\u00e8mes d&rsquo;IA ?"},"content":{"rendered":"\n<p>Les syst\u00e8mes d\u2019intelligence artificielle sont souvent per\u00e7us comme meilleurs que l\u2019humain aux t\u00e2ches qu\u2019ils r\u00e9alisent, alors qu\u2019en r\u00e9alit\u00e9 leurs performances sont parfois tr\u00e8s surestim\u00e9es.<\/p>\n\n\n\n<p>L\u2019IA est confront\u00e9e \u00e0 de nombreux d\u00e9fis techniques dont celui de la robustesse au sein d\u2019un environnement r\u00e9el. La robustesse d\u2019un syst\u00e8me d\u2019IA est sa capacit\u00e9 \u00e0 garantir des performances satisfaisantes qui se maintiennent dans le domaine dans lequel il \u00e9volue.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">L&rsquo;importance d&rsquo;un dataset de qualit\u00e9 : \u00e9tiquetage des donn\u00e9es et data augmentation<\/h2>\n\n\n\n<p>Les questions de robustesse du machine learning d\u00e9pendent en premier lieu de la qualit\u00e9 du data set fourni au syst\u00e8me d\u2019IA pour son entra\u00eenement. Les data scientists doivent s\u2019assurer, tout d\u2019abord, de manipuler une base d&rsquo;entra\u00eenement propre, c\u2019est-\u00e0-dire sans la pr\u00e9sence de <a href=\"https:\/\/numalis.com\/fr\/les-biais-techniques-de-lia-une-fatalite\/\">biais potentiels<\/a>, de donn\u00e9es corrompues ou mal \u00e9tiquet\u00e9es venant fausser les r\u00e9sultats du syst\u00e8me. Dans cet article nous nous concentrerons particuli\u00e8rement sur l&rsquo;\u00e9tiquetage des donn\u00e9es. Ces derni\u00e8res sont l\u2019\u00e9pine dorsale des algorithmes d\u2019IA fond\u00e9s sur le machine learning, mais sont aussi leur principale cause d\u2019\u00e9chec lorsqu\u2019elles ne sont pas de bonne qualit\u00e9 ou qu\u2019elles ne sont pas adapt\u00e9es au besoin sp\u00e9cifique du syst\u00e8me d\u2019IA.<\/p>\n\n\n\n<p>Le volume de donn\u00e9es disponible est devenu exponentiel car les machines se sont elles aussi mises \u00e0 produire de la donn\u00e9e en continu. N\u00e9anmoins, le challenge de la qualit\u00e9 de leur \u00e9tiquetage persiste. Selon une \u00e9tude du MIT, les dix ensembles de donn\u00e9es d&rsquo;IA les plus cit\u00e9s sont truff\u00e9s d&rsquo;erreurs d&rsquo;\u00e9tiquetage, avec notamment des images de champignons \u00e9tiquet\u00e9es comme \u00e9tant une cuill\u00e8re ou encore une note aigu\u00eb d&rsquo;Ariana Grande issue d\u2019un fichier audio \u00e9tiquet\u00e9e comme \u00e9tant \u00ab\u00a0sifflet\u00a0\u00bb<sup data-fn=\"aad8fd9b-bccf-410e-b5fa-f8b6b400f7a7\" class=\"fn\"><a href=\"#aad8fd9b-bccf-410e-b5fa-f8b6b400f7a7\" id=\"aad8fd9b-bccf-410e-b5fa-f8b6b400f7a7-link\">1<\/a><\/sup>. Ces erreurs d&rsquo;\u00e9tiquetage viennent alors fausser les performances du syst\u00e8me d\u2019IA. L\u2019adage classique en informatique ici s\u2019applique: \u201cgarbage in, garbage out\u201d, si la qualit\u00e9 est mauvaise, le syst\u00e8me le sera aussi.<\/p>\n\n\n\n<p>Deuxi\u00e8mement, les data scientists doivent veiller \u00e0 ce que leur base d&rsquo;entra\u00eenement soit suffisante. En effet, un dataset dit insuffisant selon les 4V du Big Data (volume, v\u00e9locit\u00e9, vari\u00e9t\u00e9 et la valeur) n\u00e9cessite la mise en place d\u2019une augmentation des donn\u00e9es, et ce peu importe leur type (image, fichier audio etc)<sup data-fn=\"d9ba6dd9-e09d-44e6-a22d-157f9130ff60\" class=\"fn\"><a href=\"#d9ba6dd9-e09d-44e6-a22d-157f9130ff60\" id=\"d9ba6dd9-e09d-44e6-a22d-157f9130ff60-link\">2<\/a><\/sup>. Une augmentation de donn\u00e9es permet de renforcer la robustesse d\u2019un syst\u00e8me d\u2019IA au sein d\u2019un domaine qui est d\u00e9j\u00e0 en partie couvert par ce dernier<sup data-fn=\"cb307a7a-92b6-4116-91b8-2fa4355dc0d0\" class=\"fn\"><a href=\"#cb307a7a-92b6-4116-91b8-2fa4355dc0d0\" id=\"cb307a7a-92b6-4116-91b8-2fa4355dc0d0-link\">3<\/a><\/sup>. <\/p>\n\n\n\n<p>Cependant, il ne s\u2019agit pas d\u2019une solution miracle, puisqu\u2019une base d&rsquo;entra\u00eenement trop restreinte ne permettra pas forc\u00e9ment au syst\u00e8me de performer sur un domaine non couvert malgr\u00e9 l\u2019utilisation d\u2019une augmentation de donn\u00e9es. L\u2019augmentation des donn\u00e9es permet de g\u00e9n\u00e9rer de nouvelles donn\u00e9es \u00e0 partir d\u2019une donn\u00e9e connue en les perturbant plus ou moins fortement. Il s\u2019agit par l\u2019exemple de l\u2019ajout d\u2019un flou d\u2019un degr\u00e9 d&rsquo;intensit\u00e9 variable sur une image, ou d\u2019appliquer des rotations sur celles-ci. L&rsquo;augmentation des donn\u00e9es permet de renforcer la robustesse d\u2019un syst\u00e8me d\u2019IA en l\u2019entrainant sur des donn\u00e9es d\u00e9clin\u00e9es en plusieurs variations afin d\u2019aider le syst\u00e8me \u00e0 \u00eatre r\u00e9sistant aux perturbations consid\u00e9r\u00e9es.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">La robustesse adversariale<\/h2>\n\n\n\n<p>Mais l\u2019\u00e9tiquetage et la qualit\u00e9 du dataset ne sont pas les deux seuls d\u00e9fis auxquels sont confront\u00e9s les data scientists lors de la conception de leur syst\u00e8me d\u2019IA. La robustesse adversariale est aujourd\u2019hui un champ de recherche actif du fait de la multiplication des attaques adversariales. <\/p>\n\n\n\n<p>La gen\u00e8se de ce type d&rsquo;attaque consiste \u00e0 modifier des pixels de l\u2019image (invisible \u00e0 l\u2019\u0153il nu), afin de duper l\u2019identification et la classification de l\u2019image par l\u2019IA. Ce type d\u2019attaque s\u2019apparente pour le syst\u00e8me \u00e0 une illusion d&rsquo;optique dont le but est de lui faire prendre la mauvaise d\u00e9cision<sup data-fn=\"f86e0240-9e25-47a5-8724-3521cbf1bd53\" class=\"fn\"><a href=\"#f86e0240-9e25-47a5-8724-3521cbf1bd53\" id=\"f86e0240-9e25-47a5-8724-3521cbf1bd53-link\">4<\/a><\/sup>. Ces attaques peuvent s\u2019av\u00e9rer particuli\u00e8rement dangereuses dans plusieurs situations. Par exemple, un syst\u00e8me d\u2019IA embarqu\u00e9 \u00e0 bord d\u2019une voiture sans chauffeur peut \u00eatre confront\u00e9 \u00e0 une attaque adversariale et mettre les passagers en danger. Cette derni\u00e8re se concr\u00e9tise par la pr\u00e9sence d\u2019autocollants sur l\u2019un des panneaux \u00e0 d\u00e9tecter, venant mettre \u00e0 mal la capacit\u00e9 de distinguer un panneau des autres<sup data-fn=\"2d4dd706-70f6-4b3e-a69e-50d893d30d1d\" class=\"fn\"><a href=\"#2d4dd706-70f6-4b3e-a69e-50d893d30d1d\" id=\"2d4dd706-70f6-4b3e-a69e-50d893d30d1d-link\">5<\/a><\/sup>. C\u2019est ce qu\u2019ont d\u00e9couvert des chercheurs de l&rsquo;universit\u00e9 du Michigan apr\u00e8s avoir coll\u00e9 des autocollants sur un panneau Stop que le syst\u00e8me d\u2019IA a identifi\u00e9 comme \u00e9tant un panneau affichant \u201c45 mph\u201d<sup data-fn=\"7914899a-8568-4101-83a0-0ec98fa2f331\" class=\"fn\"><a href=\"#7914899a-8568-4101-83a0-0ec98fa2f331\" id=\"7914899a-8568-4101-83a0-0ec98fa2f331-link\">6<\/a><\/sup>.<\/p>\n\n\n\n<figure class=\"wp-block-image size-full\"><img alt=\"\" fetchpriority=\"high\" decoding=\"async\" width=\"974\" height=\"383\" src=\"https:\/\/numalis.com\/wp-content\/uploads\/2025\/01\/Pandas_robustesse.png\" alt=\"\" class=\"wp-image-7154\" srcset=\"https:\/\/numalis.com\/wp-content\/uploads\/2025\/01\/Pandas_robustesse.png 974w, https:\/\/numalis.com\/wp-content\/uploads\/2025\/01\/Pandas_robustesse-300x118.png 300w, https:\/\/numalis.com\/wp-content\/uploads\/2025\/01\/Pandas_robustesse-768x302.png 768w\" sizes=\"(max-width: 974px) 100vw, 974px\" \/><figcaption class=\"wp-element-caption\">robustesse adversariale<\/figcaption><\/figure>\n\n\n\n<p>Les phases de conception et de validation sont fondamentales afin qu\u2019un syst\u00e8me d\u2019IA atteigne et garantisse ses objectifs de performance. Durant ces \u00e9tapes des outils tels que Saimple permettent par exemple d\u2019accompagner les ing\u00e9nieurs pour mesurer le risque adversarial caus\u00e9 par leur syst\u00e8me et enrichir le processus qualit\u00e9 mis en \u0153uvre. De plus, la standardisation de l\u2019IA qui se d\u00e9veloppe permet de s\u2019assurer des exigences de robustesse \u00e0 ce genre d\u2019attaque des syst\u00e8mes d&rsquo;intelligence artificielle. En t\u00e9moigne d\u2019ailleurs la parution de la norme ISO 24029-1 \u201cAssessment of the robustness of neural networks\u201d. Cette norme vise \u00e0 renforcer le processus pour s\u2019assurer de la fiabilit\u00e9 de la conception et de la validation des syst\u00e8mes d&rsquo;intelligence artificielle.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">L&rsquo;impact du domaine d&#8217;emploi sur la robustesse d&rsquo;un syst\u00e8me d&rsquo;IA<\/h2>\n\n\n\n<p>La robustesse se v\u00e9rifie par rapport \u00e0 un <a href=\"https:\/\/numalis.com\/fr\/ia-la-notion-de-domaine-dusage\/\">domaine d\u2019usage<\/a> sp\u00e9cifique. Lorsque ce dernier est amen\u00e9 \u00e0 \u00e9voluer ou \u00e0 changer, il est probable que le syst\u00e8me d\u2019IA initial ne soit pas robuste sur ce nouveau domaine. En effet, il sera confront\u00e9 \u00e0 des situations inconnues jusqu\u2019alors car non consid\u00e9r\u00e9es par les datas scientists lors de la phase d&rsquo;entra\u00eenement et de validation. Plus le nouveau domaine s\u2019\u00e9loigne de celui pr\u00e9vu initialement, plus la robustesse a de chances de baisser, car sa <a href=\"https:\/\/numalis.com\/fr\/lia-de-la-difference-entre-apprendre-et-generaliser\/\">capacit\u00e9 \u00e0 g\u00e9n\u00e9raliser<\/a> sera mise \u00e0 rude \u00e9preuve.<\/p>\n\n\n\n<p>Prenons l\u2019exemple d\u2019un syst\u00e8me d\u2019IA dont le r\u00f4le est de faire de la <a href=\"https:\/\/numalis.com\/fr\/tromper-volontairement-et-physiquement-la-reconnaissance-faciale\/\">reconnaissance faciale<\/a>. Il y a fort \u00e0 parier que ce m\u00eame syst\u00e8me soit incapable d\u2019obtenir des performances similaires lorsqu\u2019il est plac\u00e9 sous l\u2019eau puisqu&rsquo;il n\u2019a pas \u00e9t\u00e9 entra\u00een\u00e9 pour ce domaine d\u2019emploi. En effet, les cam\u00e9ras de ce syst\u00e8me seront incapables de d\u00e9tecter des visages sous l\u2019eau, puisque les images r\u00e9colt\u00e9es seront distordues \u00e0 cause de l\u2019eau ou du port d\u2019un masque et d\u2019un tuba par exemple. Les donn\u00e9es contenues dans la base d&rsquo;entra\u00eenement et celles r\u00e9colt\u00e9es en situation r\u00e9elle seront fondamentalement diff\u00e9rentes, par cons\u00e9quent le syst\u00e8me sera faillible.<\/p>\n\n\n\n<p>Mais la robustesse peut aussi varier au sein du domaine d\u2019emploi. En effet, un domaine d\u2019emploi peut \u00eatre difficile \u00e0 encadrer de par le nombre de param\u00e8tres \u00e0 prendre en compte le caract\u00e9risant. Prenons l\u2019exemple du domaine d\u2019emploi au sein duquel \u00e9voluent les voitures sans chauffeur. Il serait difficile, voire impossible, de d\u00e9finir l\u2019ensemble des r\u00e8gles et des contextes qui d\u00e9finissent ce qu\u2019est \u201cconduire sur une route en France\u201d.<br>Le moindre oubli d\u2019un param\u00e8tre (climatique, routier, environnemental\u2026), au sein du domaine d\u2019emploi, peut venir mettre en d\u00e9faut les performances d\u2019un syst\u00e8me d\u2019IA. <\/p>\n\n\n\n<p>Par exemple, au sein d\u2019un syst\u00e8me embarqu\u00e9 \u00e0 bord d\u2019une voiture sans chauffeur, de nombreux param\u00e8tres tels que l&rsquo;endommagement des panneaux (rouille, salet\u00e9 etc) peuvent mettre en \u00e9chec le syst\u00e8me d\u2019IA charg\u00e9 de les reconnaitre. Cela, alors m\u00eame que l\u2019environnement dans lequel \u00e9volue le syst\u00e8me est bien pr\u00e9d\u00e9fini.<\/p>\n\n\n\n<p>Ainsi la preuve de la robustesse des syst\u00e8mes reste encore aujourd\u2019hui l\u2019un des principaux objectifs pour favoriser l\u2019adoption des IA. Pour s\u2019assurer que les performances soient \u00e0 la hauteur des attentes malgr\u00e9 de nombreux d\u00e9fis (\u00e9tiquetage des donn\u00e9es, attaques adversariales, d\u00e9finition du domaine d\u2019emploi,), les ing\u00e9nieurs peuvent s&rsquo;appuyer, en plus des m\u00e9thodes statistiques usuelles, sur des preuves formelles.<\/p>\n\n\n<ol class=\"wp-block-footnotes\"><li id=\"aad8fd9b-bccf-410e-b5fa-f8b6b400f7a7\"><a href=\"https:\/\/www.technologyreview.com\/2021\/04\/01\/1021619\/ai-data-errors-warp-machine-learning-progress\/amp\/\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">Error-riddled data sets are warping our sense of how good AI really is<\/a> <a href=\"#aad8fd9b-bccf-410e-b5fa-f8b6b400f7a7-link\" aria-label=\"Aller \u00e0 la note de bas de page 1\">\u21a9\ufe0e<\/a><\/li><li id=\"d9ba6dd9-e09d-44e6-a22d-157f9130ff60\"><a href=\"https:\/\/cutt.ly\/WnkplWr\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">Les \u00ab 4V \u00bb | Thales Group<\/a> <a href=\"#d9ba6dd9-e09d-44e6-a22d-157f9130ff60-link\" aria-label=\"Aller \u00e0 la note de bas de page 2\">\u21a9\ufe0e<\/a><\/li><li id=\"cb307a7a-92b6-4116-91b8-2fa4355dc0d0\"><a href=\"https:\/\/www.bigdataframework.org\/four-vs-of-big-data\/\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">The Four V&rsquo;s of Big Data<\/a> <a href=\"#cb307a7a-92b6-4116-91b8-2fa4355dc0d0-link\" aria-label=\"Aller \u00e0 la note de bas de page 3\">\u21a9\ufe0e<\/a><\/li><li id=\"f86e0240-9e25-47a5-8724-3521cbf1bd53\"><a href=\"https:\/\/urlz.fr\/fJVs\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">Que sont les adversarial examples ? &#8211; United Brands Association<\/a> <a href=\"#f86e0240-9e25-47a5-8724-3521cbf1bd53-link\" aria-label=\"Aller \u00e0 la note de bas de page 4\">\u21a9\ufe0e<\/a><\/li><li id=\"2d4dd706-70f6-4b3e-a69e-50d893d30d1d\"><a href=\"https:\/\/medium.com\/@Julien_Corb\/machine-learning-et-s%C3%A9curit%C3%A9-les-exemples-contradictoires-a8b5bea331b9\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">Machine Learning et s\u00e9curit\u00e9: les exemples contradictoires | by Julien Corb | Medium<\/a> <a href=\"#2d4dd706-70f6-4b3e-a69e-50d893d30d1d-link\" aria-label=\"Aller \u00e0 la note de bas de page 5\">\u21a9\ufe0e<\/a><\/li><li id=\"7914899a-8568-4101-83a0-0ec98fa2f331\"><a href=\"https:\/\/www.caradisiac.com\/un-simple-autocollant-pour-tromper-l-intelligence-artificielle-de-la-voiture-autonome-161951.htm\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">Un simple autocollant pour tromper l&rsquo;intelligence artificielle de la voiture autonome<\/a> <a href=\"#7914899a-8568-4101-83a0-0ec98fa2f331-link\" aria-label=\"Aller \u00e0 la note de bas de page 6\">\u21a9\ufe0e<\/a><\/li><\/ol>","protected":false},"excerpt":{"rendered":"<p>Les syst\u00e8mes d\u2019intelligence artificielle sont souvent per\u00e7us comme meilleurs que l\u2019humain aux t\u00e2ches qu\u2019ils r\u00e9alisent, alors qu\u2019en r\u00e9alit\u00e9 leurs performances sont parfois tr\u00e8s surestim\u00e9es. L\u2019IA est confront\u00e9e \u00e0 de nombreux d\u00e9fis techniques dont celui de la robustesse au sein d\u2019un environnement r\u00e9el. La robustesse d\u2019un syst\u00e8me d\u2019IA est sa capacit\u00e9 \u00e0 garantir des performances satisfaisantes [&hellip;]<\/p>\n","protected":false},"author":8,"featured_media":7157,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"_seopress_robots_primary_cat":"none","_seopress_titles_title":"","_seopress_titles_desc":"","_seopress_robots_index":"","footnotes":"[{\"content\":\"<a href=\\\"https:\/\/www.technologyreview.com\/2021\/04\/01\/1021619\/ai-data-errors-warp-machine-learning-progress\/amp\/\\\" target=\\\"_blank\\\" rel=\\\"noreferrer noopener nofollow\\\">Error-riddled data sets are warping our sense of how good AI really is<\/a>\",\"id\":\"aad8fd9b-bccf-410e-b5fa-f8b6b400f7a7\"},{\"content\":\"<a href=\\\"https:\/\/cutt.ly\/WnkplWr\\\" target=\\\"_blank\\\" rel=\\\"noreferrer noopener nofollow\\\">Les \u00ab 4V \u00bb | Thales Group<\/a>\",\"id\":\"d9ba6dd9-e09d-44e6-a22d-157f9130ff60\"},{\"content\":\"<a href=\\\"https:\/\/www.bigdataframework.org\/four-vs-of-big-data\/\\\" target=\\\"_blank\\\" rel=\\\"noreferrer noopener nofollow\\\">The Four V's of Big Data<\/a>\",\"id\":\"cb307a7a-92b6-4116-91b8-2fa4355dc0d0\"},{\"content\":\"<a href=\\\"https:\/\/urlz.fr\/fJVs\\\" target=\\\"_blank\\\" rel=\\\"noreferrer noopener nofollow\\\">Que sont les adversarial examples ? - United Brands Association<\/a>\",\"id\":\"f86e0240-9e25-47a5-8724-3521cbf1bd53\"},{\"content\":\"<a href=\\\"https:\/\/medium.com\/@Julien_Corb\/machine-learning-et-s%C3%A9curit%C3%A9-les-exemples-contradictoires-a8b5bea331b9\\\" target=\\\"_blank\\\" rel=\\\"noreferrer noopener nofollow\\\">Machine Learning et s\u00e9curit\u00e9: les exemples contradictoires | by Julien Corb | Medium<\/a>\",\"id\":\"2d4dd706-70f6-4b3e-a69e-50d893d30d1d\"},{\"content\":\"<a href=\\\"https:\/\/www.caradisiac.com\/un-simple-autocollant-pour-tromper-l-intelligence-artificielle-de-la-voiture-autonome-161951.htm\\\" target=\\\"_blank\\\" rel=\\\"noreferrer noopener nofollow\\\">Un simple autocollant pour tromper l'intelligence artificielle de la voiture autonome<\/a>\",\"id\":\"7914899a-8568-4101-83a0-0ec98fa2f331\"}]"},"categories":[152],"tags":[186],"class_list":["post-7150","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-ia-technique","tag-semantique"],"acf":[],"_links":{"self":[{"href":"https:\/\/numalis.com\/fr\/wp-json\/wp\/v2\/posts\/7150","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/numalis.com\/fr\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/numalis.com\/fr\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/numalis.com\/fr\/wp-json\/wp\/v2\/users\/8"}],"replies":[{"embeddable":true,"href":"https:\/\/numalis.com\/fr\/wp-json\/wp\/v2\/comments?post=7150"}],"version-history":[{"count":0,"href":"https:\/\/numalis.com\/fr\/wp-json\/wp\/v2\/posts\/7150\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/numalis.com\/fr\/wp-json\/wp\/v2\/media\/7157"}],"wp:attachment":[{"href":"https:\/\/numalis.com\/fr\/wp-json\/wp\/v2\/media?parent=7150"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/numalis.com\/fr\/wp-json\/wp\/v2\/categories?post=7150"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/numalis.com\/fr\/wp-json\/wp\/v2\/tags?post=7150"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}