Est-ce que l'on peut parler de créativité pour les algorithmes d'intelligence artificielle ? En quoi est-ce que cela consiste vraiment ?
On prête beaucoup de compétences à l’intelligence artificielle : des capacités de calcul énormes, de grandes précisions en termes de reconnaissance d’images ou encore le traitement automatisé de tâches fastidieuses. Pourtant, l’IA a encore des difficultés concernant les domaines avec des capacités fondamentalement humaines comprenant de la communication ou de la créativité. Effectivement, la compréhension du contexte, du second degré ou encore le fonctionnement dans des environnements nouveaux, sont autant de capacités qui posent problèmes à l’IA. Cependant, dans plusieurs domaines artistiques, des systèmes d’IA commencent à être développés dans l’objectif de produire automatiquement un résultat artistique qui pourrait parfois rivaliser avec des œuvres de maîtres. Mais pouvons-nous réellement parler de créativité lorsqu’une IA ne fait que d’apprendre sur des données existantes pour imiter un style d’art ?
En 2016 a été présentée une toile, au style de Rembrandt, réalisée par une IA. Elle a été effectuée à l’aide d’une imprimante 3D afin de rendre les différentes couches de peinture plus réalistes. La base de données utilisée pour faire l’apprentissage de l’algorithme comprenait 300 œuvres de Rembrandt. Le réalisme fut tel que les profanes n’ont su distinguer si l'œuvre était une création du peintre Rembrandt en personne ou celle d’un système d’IA (1).
Mais pour autant le portrait à la “manière de” n’est pas le fruit de la créativité du système d’IA mais celui des ingénieurs informatiques ayant constitué la base d'entraînement de l'algorithme. En effet, ce sont eux qui ont déterminé le domaine d’emploi du système d’IA. On pourrait donc en déduire que l’IA n’a ici aucune capacité de créativité. L’utilisation de l’apprentissage supervisé, dans le but de reproduire ou de répliquer un style d’oeuvre, est courant et c’est notamment le cas dans l’industrie de la musique où une musique des Beatles “Daddy's Car“ a été composé par une IA de l’entreprise Flowmachine (5).
De la même manière, en 1997, l’ordinateur DeepBlue d'IBM a battu Gary Kasparov aux échecs grâce à sa capacité de calculs (bien supérieure à celles d’un humain) s’appuyant sur sa base d'entraînement composée de milliers de parties des meilleurs joueurs du monde. Bien que cela fut un tournant pour l’industrie de l’IA, peut-on dire que le système d’IBM fut vraiment créatif ? Encore une fois non, car il s’est servi de la connaissance humaine implantée dans sa base de données pour sélectionner ses futurs coups. DeepBlue n’a gagné que par simulation et grâce à sa capacité d’anticipation en déduisant plusieurs coups à l’avance (2).
Pour réellement sortir des sentiers battus il faut faire intervenir un nouveau type d’apprentissage, celui par renforcement, qui peut s’apparenter aux méthodologies de type essai/erreur. Les tentatives successives de l’algorithme sont ici plus ou moins récompensées. Le but est de laisser un algorithme apprendre par lui-même, en lui fournissant seulement un environnement réalisant les règles d’un jeu et une manière de mesurer sa performance. Ainsi cela peut être de voir si l’algorithme a gagné ou perdu, combien de points il a accumulé, etc. Celui-ci sera alors en capacité de jouer des milliers de parties en renforçant à chaque fois les enchaînements de coups gagnants et en diminuant ceux qui ne le conduisent pas à la victoire. Contrairement aux autres techniques d’apprentissages supervisés qui l’orientent dans son entraînement, dans ce cas l’algorithme n’est pas contraint dans son exploration de l’espace de jeu. Il aura ainsi plus de possibilités de mettre au point des stratégies nouvelles. Les concepteurs gardent néanmoins encore la main sur la manière dont ce renforcement est structuré. Les choix du système de récompenses/punitions et les enchaînements des phases d'entraînement progressives restent généralement à la main des concepteurs. C’est sur ce concept que les chercheurs de DeepMind ont développé AlphaGo Zero, un algorithme pouvant développer des stratégies sur plusieurs jeux tels que les échecs ou le jeu de Go. Ainsi, ce système d’IA a pu s'entraîner contre lui-même à travers 21 millions de parties de Jeu de Go en seulement deux semaines (3). À la suite de son entraînement, AlphaGo Zero a été confronté à Alpha Go (son prédécesseur fonctionnant grâce à un apprentissage supervisé). Sur les 100 parties réalisées entre ces deux algorithmes, toutes ont été remportées par AlphaGo Zero.
Il semblerait donc que l’algorithme soit capable de trouver seul dans l’espace des coups possibles de nouvelles stratégies jamais envisagées par l’Homme auparavant. Sur le jeu des échecs les spécialistes ont été impressionnés de voir que l’algorithme a redécouvert par lui-même toutes les ouvertures traditionnelles des échecs alors même qu’il a fallu des siècles aux Hommes pour accumuler cette connaissance. Aujourd’hui, AlphaGo Zero continue de s’améliorer en développant de nouvelles stratégies en s'entraînant contre elle-même. Il ne faut pas néanmoins perdre du vue que l’avantage fondamental de tout algorithme est que dans ce contexte il peut réaliser des parties en quelques fractions de seconde, alors qu’un humain y passerait des heures. Sa capacité massive de traitement le rend plus performant à explorer des nouvelles stratégies et n’en garder que les meilleures.
Nous pouvons enfin parler du programme Deep Dream Google conçu pour générer des images à partir d’un réseau de neurones convolutif. Le programme utilise des structures de réseaux de neurones permettant de rendre explicite ce que le réseau de neurones a cru percevoir. En forçant à faire apparaître les caractéristiques que le réseau a perçu, le système produit ces images dont l’apparence est un peu hallucinogène (4). Cette technique s’apparente à la paréidolie qui désigne la tendance qu’a le cerveau humain à fournir une interprétation significative d'un stimulus ambigu, généralement visuel, de sorte qu'une personne voit un objet, un motif ou une signification là où il n'y en a pas. C’est le cas par exemple quand une personne reconnaît des formes dans les nuages.
La compréhension humaine reste difficile à appréhender pour l’IA. Cependant, la créativité considérée comme une compétence typiquement humaine, semble pouvoir être reproduite en partie par la machine. D’autres domaines de l’IA pourront apporter des évolutions aux algorithmes pour leur permettre d’acquérir d’autres compétences humaines : comme le NLP (Natural Language Processing) ou l’intelligence émotionnelle. Par ailleurs, leurs développements pourront encore faire évoluer le semblant de créativité de l’IA, à l’image des avancées permises par l’apprentissage par renforcement.
Retrouvez tous nos articles sur : https://numalis.com/publications.php