Auteur: Christophe ALIAGA - mar. 18 Fév 2025

Intelligence Artificielle (IA) : Comprendre et appréhender l'IA contemporaine

Durée de lecture : > 1 heure.

L’intelligence artificielle (IA) est habituellement définie comme un ensemble de techniques et de systèmes informatiques qui sont capables de simuler des processus cognitifs humains en se reposant sur des algorithmes d’apprentissage automatique. Or, cette définition déjà vague, confuse et limitée est aujourd’hui réduite au spectre des LLM (Large Langage Model), qui, dans l’esprit collectif, constituent l’intelligence artificielle. Ce qui génère encore plus de confusion et renforce des postulats dogmatiques dont il faut absolument sortir, car ils nous conduisent à une perte de contrôle.

Pour mieux comprendre les enjeux de demain, chacun doit savoir différencier les nuances que chaque définition associée à l’IA intègre dans son énoncé, ceci pour distinguer la vérité dans le bruit informationnel incessant.

Pour y arriver, il faut commencer par se rappeler l’histoire de l’IA, qui, dès les années 50, s’est faite sur des promesses sans fondements. À l’époque déjà, des avancées jugées spectaculaires ont suscité une cacophonie sans précédent autour d’attentes, qui toutes, sans exception, ont laissé place à la désillusion, entraînant une période de glaciation dite hiver de l’IA.

Aujourd’hui, nous assistons au même phénomène, à ceci près que l’IA va, cette fois-ci, réellement changer la face du monde.

Dans cet article, nous allons démystifier chaque concept, pour naviguer avec plus de clarté dans un espace embrouillé par des discours excessifs qui s’appuient sur la confusion.

L’histoire de l’intelligence artificielle

L’histoire de l’intelligence artificielle (IA) s’étend sur plusieurs décennies, marquées par des moments clés qui ont façonné son développement et son intégration dans notre quotidien.

Début de l’intelligence artificielle (années 1950)

Dans les années 1950, Alan Turing, pionnier en informatique, propose le célèbre test de Turing, une mesure de l’intelligence des machines. Ce test vise à évaluer la capacité d’une machine à imiter un comportement humain de manière indiscernable.

Conférence de Dartmouth en 1956

La conférence de Dartmouth en 1956 réunit des chercheurs de renom tels qu’John McCarthy, Marvin Minsky et Claude Shannon, qui ensemble établissent les bases du domaine. Ils posent des questions fondamentales sur la capacité des machines à simuler l’intelligence humaine. Cette rencontre ne se limite pas à un échange d’idées ; elle incarne une vision collective d’un avenir où les ordinateurs pourraient non seulement exécuter des tâches, mais également apprendre et s’adapter.

Développement des premiers programmes d’IA (années 1960)

Dans les années 1960, les premiers programmes d’IA émergent, tels que ELIZA, qui simule une conversation thérapeutique en imitant un psychologue. Cette avancée illustre la capacité des machines à interagir avec les humains, bien qu’à un niveau rudimentaire. Parallèlement, SHRDLU, un autre programme, démontre la compréhension du langage naturel en interagissant avec un environnement de blocs. Ces développements initiaux suscitent un engouement aussi important que celui auquel nous assistons de nos jours, depuis le lancement de ChatGPT fin 2022.

Hivers de l’IA (années 1970-1980)

Les décennies suivantes, notamment les années 1970 et 1980, subissent un ralentissement marqué, qualifié d’« hivers de l’IA ». Ce terme désigne une période de désillusion où l’intérêt et le financement pour les projets d’IA chutent, en raison de promesses non tenues et de résultats décevants. Les attentes élevées des chercheurs ne se concrétisent pas, entraînant des revers qui affectent la crédibilité du domaine.

Renaissance de l’IA avec les réseaux de neurones (années 1980-1990)

Face aux limitations des approches symboliques et logiques qui ont dominé les décennies précédentes, les chercheurs explorent de nouvelles voies prometteuses : l’apprentissage automatique et les réseaux de neurones.

Ce changement de paradigme s’appuie sur l’idée que les machines peuvent apprendre par elles-mêmes à partir de données, sans être explicitement programmées. Les algorithmes d’apprentissage automatique permettent aux systèmes d’identifier des modèles et des relations dans de vastes ensembles de données, ouvrant la voie à des applications plus flexibles et adaptatives.

Ce changement de paradigme jette les bases de l’essor de l’apprentissage profond et de l’IA moderne, qui transformeront de nombreux secteurs dans les décennies à venir.

Ce qui sera poussé par un événement en particulier, lorsque Deep Blue bat le champion d’échec Garry Kasparov en 1997. Bien que Deep Blue, ne soit pas basé sur l’apprentissage automatique, son succès contribue largement à stimuler de nouveau l’intérêt et les investissements dans l’IA, qui désormais, intègre le paradigme de l’apprentissage profond et des réseaux de neurones.

Le paradigme de l’apprentissage profond et des réseaux de neurones imprègne désormais le secteur de l’intelligence artificielle

Avancées récentes dans l’IA (années 2000-2020)

Les deux décennies suivantes, de 2000 à 2020, sont marquées par une mise en œuvre massive de l’intelligence artificielle dans divers domaines. L’intégration par des entreprises comme Google et Apple de systèmes de reconnaissance vocale et faciale dans leurs produits révolutionne la manière dont les utilisateurs perçoivent et utilisent la technologie au quotidien. Cette démocratisation de l’IA résulte directement des avancées réalisées dans le domaine de l’apprentissage automatique et des réseaux de neurones au cours des décennies précédentes.

L’exploitation de l’IA par les plateformes de streaming telles que Netflix et Amazon dans leurs systèmes de recommandation est elle aussi une conséquence directe de la capacité des algorithmes d’apprentissage à identifier des modèles et des relations dans de vastes ensembles de données. En analysant les comportements de visionnage et les préférences individuelles, ces systèmes d’IA sont en mesure de proposer un contenu personnalisé, favorisant la rétention et la satisfaction des utilisateurs.

Le succès de ce modèle de recommandation entraîne par ailleurs une transformation profonde de la consommation de contenu et de la conception de l’offre par les entreprises. L’émergence de TikTok , qui s’appuie fortement sur des algorithmes de recommandation, illustre parfaitement l’impact de cette approche.

Ces avancées dans le domaine de l’IA, rendues possibles par le changement de paradigme vers l’apprentissage automatique et les réseaux de neurones, ont des répercussions profondes sur de nombreux aspects de la vie quotidienne et des pratiques commerciales. Elles ouvrent la voie à une ère nouvelle où l’intelligence artificielle devient omniprésente et transforme en profondeur la société.

Les modèles d’IA fonctionnant sur des réseaux de neurones et l’apprentissage profond sont omniprésents, mais demeurent invisibles aux yeux du grand public.

2023 : tout s’accélère

L’émergence de ChatGPT en novembre 2022 s’inscrit dans la continuité du changement de paradigme vers les réseaux neuronaux et l’apprentissage profond. Cette avancée majeure découle directement des progrès réalisés dans le domaine du traitement du langage.

ChatGPT ne se limite pas à générer du texte ; il promet d’être un assistant virtuel capable de dialoguer de manière fluide et pertinente dans divers contextes.

Il apporte dans son sillage l’espoir de l’AGI (Intelligence Artificielle Général) et ouvre la voie vers l’ASI (Super Intelligence Artificielle).

Mais ces nouvelles perspectives, offertes par la capacité de dialoguer avec un système, confrontent l’humanité à des questions restées en suspens jusque là.

D’autre part, cette apparente simplicité qu’offre le langage dans l’intermédiation de l’agir (via la machine) a rapidement laissé place à une complexité insoupçonnée qui, de nouveau, freine une adoption généralisée.

L’engouement, bien que très fort, reste restreint au milieu digital qui fait face à une saturation inquiétante de contenu généré par IA et d’innombrables problèmes, comme l’alignement, la réglementation, la sécurité, la souveraineté, etc.

Le secteur de l’intelligence artificielle tend désormais vers le paradigme de l’AGI et de l’ASI.

2025 : adoption promue de l’intelligence artificielle malgré les risques

Le début de l’année 2025 a été marqué par une nouvelle accélération, catalysée par deux événements.

Premièrement, l’arrivée au pouvoir de Donald Trump a radicalement libéralisé l’usage de l’IA par une ordonnance signée le 23 janvier 2025, visant à rétablir la domination des États-Unis dans le domaine de l’IA en supprimant les politiques existantes considérées comme des obstacles à l’innovation. Trump a officialisé dans la foulée le projet Stargate, avec un investissement monumental prévu de 500 milliards de dollars, faisant de l’IA une des priorités nationales.

Deuxièmement, quelques jours après ces annonces et décisions, l’émergence d’une IA chinoise (DeepSeek) a révolutionné le secteur en offrant des solutions plus efficaces à un coût inférieur que les leaders américains du secteur.

Ce développement a plongé l’industrie de l’IA dans la tourmente, révélant des enjeux de pouvoir et politiques majeurs. Les données, alors envoyées en Chine, ont soulevé des inquiétudes sur la souveraineté et la sécurité, car ces pratiques favorisent la propagation du narratif chinois. Certains ont alors proposé des lois visant à interdire l’utilisation et le téléchargement de cette IA chinoise, suggérant des peines d’emprisonnement allant jusqu’à 20 ans pour le simple fait de télécharger le modèle d’IA.

Face à cette dynamique où la confusion régnait déjà dans les définitions, une compréhension fine de ce qu’est l’intelligence artificielle devient cruciale, car s’ajoute à la confusion dans les définitions, celle autour de ses implications pendant que des risques de plus en plus importants sont pris. La nécessité d’une réflexion éthique et politique sur l’utilisation de l’IA se fait donc pressante.

Mais pour ce faire, il faut comprendre de quoi l’on parle, et quelles sont les évolutions qui nous ont amenés là où nous en sommes.

Focus sur l’évolution des paradigmes récents de l’intelligence artificielle

La chronologie des évolutions nous montre le tournant décisif des années 1980 et 1990 durant lesquelles les réseaux de neurones et l’apprentissage automatique deviennent progressivement centraux.

La sortie de l’hiver de l’IA coïncide d’ailleurs avec ce “recentrage”, qui, plus tard en 2006, recevra un coup de projecteur avec les travaux de Geoffrey Hinton et le concours ImageNet qui feront véritablement renaître l’intérêt pour l’IA.

- 2006 : Geoffrey Hinton publie un article sur l’apprentissage profond, révolutionnant le domaine de l’IA.
- 2012 : Le réseau de neurones convolutifs AlexNet remporte le concours ImageNet, ouvrant la voie à la reconnaissance visuelle avancée.

Puis, c’est en 2017, dans la continuité de cette approche de l’IA, que l’architecture Transformer, présentée par Vaswani et al. dans une publication, révolutionne le traitement du langage naturel par sa capacité à gérer des dépendances à long terme dans le texte.

Dans la foulé, dès 2018, OpenAI commence à écrire l’histoire en publiant GPT (Generated Pretrained Transformer), un modèle basé sur l’architecture Transformer dont les résultats montrent une propension à s’améliorer proportionnellement à la quantité de données et à la largeur du modèle.

Naissance d’un nouveau paradigme : la mise à échelle fait l’intelligence

S’en suivront des avancées confirmant à chaque fois que l’augmentation de la taille du modèle et de l’ensemble de données améliore la cohérence et la pertinence des réponses générées.

2019 : Développement de GPT-2 OpenAI dévoile GPT-2 avec 1,5 milliard de paramètres, démontrant que l’augmentation de la taille du modèle et de l’ensemble de données améliore la cohérence et la pertinence des réponses générées.

L’accès à des données massives issues d’Internet devient crucial pour augmenter les échelles et donc l’intelligence.

2020 : Lancement de GPT-3 GPT-3, avec ses 175 milliards de paramètres, prouve une nouvelle fois que davantage de données et de capacités de calcul permettent de couvrir une gamme plus large de tâches linguistiques, avec une performance impressionnante sur des tâches complexes avec peu d’exemples.
2021 : Études sur le Scaling Laws. Des recherches, comme celles menées par Kaplan et al., formalisent le concept selon lequel la performance des modèles de langage continue de croître avec l’augmentation exponentielle des données et des paramètres, tout en optimisant les coûts de calcul.

Confirmation du paradigme basé sur le volume de données, la taille des modèles et la puissance de calcul.

2022-2023 : Applications et développements continus.
L’industrie et la recherche poursuivent leurs avancées sur les bases de ce paradigme quantitatif, approfondissant des domaines tels que le traitement de texte, la traduction automatique, et la génération de contenus. Ce qui aboutira à des modèles toujours plus performants et intelligents, confirmant à chaque fois que l’augmentation du volume de données et de la taille des modèles est une stratégie efficace et fiable.

Pendant ce temps, des impacts sectorielles sont observés

Parallèlement à la trajectoire spécifique prise par les modèles Transformer, d’autres avancées confirment la pertinence des réseaux de neurones et de l’apprentissage automatique. Ces derniers font leurs preuves dans plusieurs secteurs, concourant progressivement, mais surement à préparer l’avènement de l’IA.

Applications de l’IA dans la santé :

2015 : IBM lance Watson Oncology, un système d’aide à la décision pour les oncologues.
- Analyse des dossiers médicaux par ML et NLP.
- Aide au diagnostic et au traitement du cancer.
2016 : Google DeepMind développe un algorithme pour détecter les maladies oculaires à partir de scans rétiniens.
- Détection par réseaux de neurones convolutifs (CNN).
- Apprentissage profond pour analyser les scans rétiniens.
2018 : La FDA approuve IDx-DR, un algorithme d’IA pour le diagnostic de la rétinopathie diabétique sans intervention humaine.
- Utilisation de CNN et apprentissage profond.
- Analyse des images de la rétine.
2020 : L’IA face à la pandémie de COVID-19
- L’IA est largement utilisée pour faire face à la pandémie de COVID-19, du suivi de la propagation au développement de traitements.
- Suivi de la propagation du virus.
- Développement de traitements.
- Techniques d’apprentissage automatique : réseaux de neurones, analyse de données.

Applications dans la finance :

2009 : Les institutions financières commencent à expérimenter l’apprentissage automatique pour détecter les fraudes.
- Algorithmes supervisés : arbres de décision, réseaux de neurones
- Outils émergents : scikit-learn, H2O.ai
2015 : Le deep learning connaît un essor dans le trading algorithmique et l’analyse des marchés financiers.
- Généralisation des RNN pour l’analyse des séries temporelles
- Démocratisation des librairies : Keras, TensorFlow
2018 : L’IA s’impose comme un moteur de transformation des services financiers.
- JPMorgan Chase lance COiN : NLP et ML pour analyser les contrats
- Raffinement des techniques de NLP : word2vec, BERT
- Multiplication des librairies spécialisées : spaCy, Hugging Face
- Généralisation des librairies Python pour le ML

Transformation du marketing :

2010 : Amazon intègre des algorithmes d’apprentissage automatique pour offrir des recommandations ultra-personnalisées à ses clients, ouvrant la voie à une nouvelle ère du e-commerce.
- Utilisation du filtrage collaboratif et des réseaux de neurones
- Analyse des historiques d’achat et des comportements des utilisateurs
2015 : Facebook exploite pleinement l’apprentissage automatique et l’analyse de données pour comprendre les intérêts et les comportements des utilisateurs, permettant un ciblage publicitaire d’une précision inégalée.
- Analyse des interactions, des likes et des partages
- Segmentation fine des audiences publicitaires
- Optimisation des campagnes en temps réel
2018 : Alibaba franchit une nouvelle étape en utilisant des réseaux de neurones récurrents et des techniques de traitement du langage naturel pour générer automatiquement des descriptions de produits et des campagnes marketing.
- Génération de textes persuasifs et adaptés aux produits
- Personnalisation des messages en fonction des préférences des clients
- Optimisation des performances des campagnes grâce à l’apprentissage continu

Applications dans la logistique :

2012 : Amazon robotise ses entrepôts avec l’acquisition de Kiva Systems
- Utilisation d’algorithmes d’apprentissage par renforcement et de réseaux de neurones
- Navigation autonome et manipulation précise des objets
- Optimisation des processus de stockage et de préparation des commandes
2016 : DHL déploie des robots collaboratifs et des véhicules autonomes
- Utilisation de techniques d’apprentissage automatique et de réseaux de neurones
- Collaboration fluide entre les robots et les opérateurs humains
- Optimisation des flux de marchandises et réduction des erreurs
2019 : UPS obtient l’approbation de la FAA pour les livraisons par drones
- Utilisation de l’apprentissage automatique pour la planification de trajectoire et la détection d’obstacles
- Navigation autonome et prise de décision en temps réel
- Optimisation des itinéraires et réduction des délais de livraison

La conjugaison de ces succès d’application a non seulement préparé les entreprises à surfer sur la vague des modèles Transformers, mais aussi le grand public, qui, sans le savoir, était déjà confronté aux réseaux de neurones et à l’apprentissage automatique au quotidien.

Ainsi, pendant que le paradigme des réseaux de neurones et à l’apprentissage automatiques s’installait tous azimuts, celui de l’intelligence par la mise à échelle des modèles Transformers faisait aussi ses preuves en parallèle.

2023 : GPT-3 redéfinit le concept d’intelligence artificielle

Le lancement de GPT-3 fin 2022 a marqué un tournant majeur, redéfinissant la notion même d’intelligence artificielle, car occupant toute dans l’esprit du public.

Les promesses et les spéculations ont fusé de toutes parts, faisant craindre un remplacement immédiat du travail humain par la machine. Des rumeurs et des fantasmes ont émergé, rappelant l’effervescence des années 50, mais avec une différence notable : l’IA était désormais accessible au grand public, à bas coût, et capable de communiquer de manière fluide et rapide.

Ce qui n’est pas un détail, car l’échange par les mots constitue le facteur d’intermédiation par excellence entre l’homme et la machine, facteur ultime de productivité, efficacité et pertinence.

Un modèle Transformer peut en effet, effectuer la plupart des tâches de tous les autres types d’intelligence artificielle, mais avec une capacité de raisonnement en plus, permettant d’envisager l’autonomie et l’automatisme poussé à l’extrême.

Ceci implique des applications sensibles (santé, défense, finance) concrètes et potentiellement déployables à moyen terme, donnant d’autant plus d’intérêt au secteur, qui pouvait alors miser sur l’AGI.

La désillusion face à la complexité du langage

Mais l’euphorie initiale a rapidement, une fois encore, laissé place à une nouvelle désillusion. L’utilisation des mots dans les instructions données à une machine s’est avérée bien plus complexe qu’il n’y paraissait. Les subtilités du langage humain, avec ses nuances, ses ambiguïtés et ses contextes variables, ont posé des défis considérables aux modèles d’IA. Malgré leur capacité à générer des réponses impressionnantes, ces systèmes ont montré des limites dans la compréhension profonde du sens et de l’intention derrière les mots.

L’émergence des prompts ingénieurs

Pour pallier ces difficultés, un nouveau métier est apparu : celui de prompt ingénieur. Ces spécialistes se sont consacrés à l’art de formuler des instructions précises et efficaces pour guider les modèles d’IA. Leur expertise s’est avérée essentielle pour obtenir des résultats pertinents et cohérents. Cependant, cette nouvelle couche d’expertise a également rehaussé le coût d’intégration de l’IA dans les processus existants, réduisant ainsi l’attrait initial pour cette technologie.

2023 – 2024 : élargissement de la nouvelle définition de “intelligence artificielle”

Les avancées des modèles Transformers ont initialement limité leurs capacités aux tâches textuelles, telles que l’analyse de texte, la correction et la génération de contenu. Cependant, de nombreux nouveaux modèles ont émergé de divers acteurs du secteur, créant une concurrence intense visant à trouver des débouchés et marchés.

Cette compétition a stimulé le développement de fonctionnalités avancées et de modalités d’usage innovantes, donnant naissance à des modèles Transformers multimodaux. Ces derniers permettent, à partir d’instructions textuelles, de générer des images, des vidéos, et, inversement, de transposer des images en texte ou de transcrire une vidéo en texte.

Dimension immersive du concept de l’IA

La définition de l’intelligence artificielle a ainsi pris une dimension immersive, mêlant texte, image, son et vidéo. Toutefois, le concept d’IA reste fortement associé aux modèles GPT (Generative Pretrained Transformer), qui constituent la clé de ces possibilités. Par exemple, les actions de type “Text to Image” ou “Text to Video” reposent sur le langage. Même l’analyse d’image, bien qu’elle ne soit pas initialement textuelle, doit être interprétée par un Transformer pour produire un résultat textuel.

Cette approche s’applique à de nombreuses autres applications, telles que la programmation à partir de texte, le résumé automatique, la création de sites web ou de documents PDF, et bien d’autres, dans les deux sens. Pourtant, en se concentrant sur la multimodalité, le monde tend à oublier que tout cela repose sur les mots, ces outils que l’humain utilise pour donner des instructions à la machine. Ce qui posera inévitablement problème et redéfinira encore les contours de ce qu’évoque l’intelligence artificielle.

D’ailleurs, il est aussi question de notions politiques dans cette définition.

2025 : la définition de l’intelligence artificielle intègre une dimension géopolitique

L’arrivée fracassante de DeepSeek sur le marché a suscité des inquiétudes croissantes parmi les observateurs, qui perçoivent cette innovation comme un risque majeur pour la sécurité, en particulier aux États-Unis. Ce risque s’articule autour de la souveraineté, car le traitement des données des utilisateurs américains repose sur l’acceptation des conditions d’utilisation. En d’autres termes, le consentement implicite des utilisateurs ouvre la porte à une exploitation de leurs informations personnelles par la Chine.

En outre, la disponibilité du dernier modèle de raisonnement de DeepSeek, sous licence MIT, surpassant les IA d’OpenAI, intensifie les craintes liées à une atteinte à la souveraineté cognitive. Ces craintes s’exacerbent autour d’un narratif sous-jacent, associé à la Chine, renforçant la perception d’une menace.

Certaines voix, alarmées comme celle du sénateur Josh Hawley, vont jusqu’à proposer des mesures draconiennes, telles que l’interdiction pure et simple du téléchargement de l’IA DeepSeek, envisageant des peines de prison pour quiconque oserait l’utiliser ou le télécharger.

Pourtant, l’utilisation d’un modèle d’IA, même étranger, lorsque celui-ci est isolé, hébergé sur un territoire souverain et opéré par une entreprise locale, ne conduit pas nécessairement à un partage de données. Ce qui souligne que l’inquiétude porte effectivement sur la subversion engendrée par le narratif associé au modèle.

Ce risque subtil, mais tout aussi significatif, certaines personnes le minimisent encore, mais il est bien réel et tends à être intégré dans la définition de l’IA, cette dernière étant aussi un outil politique de Soft Power et de subversion, autrement dit, une arme.

D’autre part, Méta s’est vu reprocher d’avoir publié en open source des versions de son modèle d’IA Llama. Ce dernier a largement été utilisé par les ingénieurs de DeepSeek pour concevoir leur modèle d’IA de raisonnement, aussi certains voient, dans l’approche Open Source du groupe Méta, une trahison d’ordre nationale.

C’est dire à quel point la définition de l’intelligence revêt d’innombrables dimensions qui plus est évoluent en permanence.

Ainsi, l’évolution des paradigmes de l’IA influe sur ses différentes définitions et les modifie en permanence, au fil des fonctionnalités, des évolutions d’algorithme, mais aussi, selon le niveau de menace perçue sur un plan géopolitique.

Maintenant que nous avons éclairé l’évolution des paradigmes de l’IA, ceci afin de tempérer les notions qu’elle inclut dans sa perception, nous pouvons sereinement nous attarder sur les différentes définitions techniques de l’intelligence artificielle pour ensuite mieux comprendre les profonds bouleversements que les modèles transformer et leurs ascendants multimodaux impliquent.

Retours aux sources : les définitions conventionnelles de l’intelligence artificielle (IA)

L’intelligence artificielle (IA) est communément définie par des systèmes capables d’apprendre et de s’adapter à de nouvelles situations. Ce qui englobe une infinité des définitions sous-jacentes, source de la confusion.

Pour mieux comprendre, il nous aborderont la définition de l’IA par ses deux principaux objectifs que sont la prédiction et l’automatisation.

L’IA est un outil pour prédire à partir de données : particulièrement utile dans des domaines comme la finance, la défense ou la santé.

L’IA est une solution pour automatiser des tâches complexes pour améliorer l’efficacité et l’innovation.

Ces deux objectifs sont mis en application grâce à la capacité de l’IA à traiter des quantités massives de données, pour en extraire les informations nécessaires à la prédiction et à l’automatisation.

L’intelligence artificielle pour prédire

Le point de départ de toute prédiction réside dans les données, ces dernières devant être massives pour avoir un impact significatif.

Cela nécessite une approche spécifique, appelée apprentissage non supervisé, qui permet d’explorer et de révéler des structures cachées au sein des ensembles de données.

Établir des corrélations avec l’apprentissage non supervisé

L’apprentissage non supervisé s’avère particulièrement utile dans des contextes où les étiquettes de classe (catégories de classification) ne sont pas disponibles, permettant ainsi aux systèmes d’IA d’explorer les données de manière autonome.

Méthodes :

Deux méthodes se distinguent dans ce domaine : le clustering et la réduction de dimensionnalité.

Méthode du clustering

Le clustering, ou regroupement, vise à organiser un ensemble de données en groupes basés sur des caractéristiques similaires.

Technique de clusturing

Plusieurs techniques sont employées pour réaliser cette tâche :

K-Means : Cette technique regroupe les données similaires afin d’identifier des groupes naturels. En définissant un nombre prédéterminé de clusters, K-Means assigne les points de données à la classe la plus proche, ce qui permet de créer des partitions claires au sein des données.
Clustering hiérarchique : Cette technique crée une hiérarchie de clusters, révélant ainsi les relations entre les données. En construisant un arbre de décision, le clustering hiérarchique permet d’explorer les données à différents niveaux de granularité, facilitant l’identification des structures sous-jacentes.
DBSCAN : En se basant sur la densité des points de données, la méthode DBSCAN identifie des groupes denses capables de gérer des formes de clusters non conventionnelles. Ce modèle est particulièrement efficace pour détecter des clusters de forme arbitrée, tout en ignorant le bruit présent dans les données.

Méthode de réduction de dimensionnalité

La réduction de dimensionnalité représente une méthode pour simplifier les données tout en préservant l’information essentielle.

Cette approche est d’une importance capitale, surtout lorsque les données évoluent dans des espaces de haute dimension (Ensembles de données comportant un grand nombre de variables).

Techniques de réduction de dimensionnalité

Analyse en composantes principales (PCA) : PCA permet de réduire la dimensionnalité des données en transformant les variables d’origine en un ensemble de nouvelles variables non corrélées, appelées composantes principales. Ce processus conserve la majorité de la variance des données, facilitant ainsi leur analyse tout en réduisant leur complexité.
t-SNE : t-SNE est une technique avancée qui permet de visualiser les structures locales des données de haute dimension. En conservant les relations entre points proches, t-SNE produit des représentations visuelles denses et significatives, offrant ainsi des aperçus enrichis des données complexes.

Capturer des représentations complexes avec l’apprentissage profond

Cette approche de la prédiction (apprentissage profond) est celle sur laquelle reposent les modèles Transformers, mais pas uniquement.

Support d’apprentissage profond (DeepLearning)

Réseaux de neurones convolutifs (CNN) : Ces modèles sont particulièrement adaptés à la prédiction dans le domaine de la vision par ordinateur, où ils apprennent à extraire des caractéristiques essentielles des images. Grâce à leur capacité à traiter des données spatiales, les CNN permettent des avancées significatives dans la reconnaissance d’images et la classification visuelle.
Réseaux de neurones récurrents (RNN) : Les RNN sont conçus pour prédire des séquences temporelles, apprenant à modéliser des dépendances au fil du temps. Ce type de réseau est essentiel dans des applications telles que la traduction automatique et l’analyse des séries chronologiques.
Traitement du langage naturel (NLP) : Analyse de sentiments, reconnaissance d’entités nommées, traduction automatique : Ces outils permettent de capturer des représentations complexes du texte, optimisant ainsi les analyses de données massives et facilitant l’identification d’informations spécifiques.
- Transformers : L’architecture des modèles Transformers repose sur une matrice d’attention, qui permet au modèle de se concentrer sur des parties spécifiques d’une séquence de mots, capturant ainsi des relations encore plus profondes et complexes et améliorant la gestion des dépendances contextuelles. Cette capacité d’attention rend les Transformers particulièrement efficaces.

On comprend ici que les Transformers ne représentent qu’une fraction de ce qu’englobe l’intelligence artificielle, mais leur architecture attentionnelle est leur facteur distinctif qui leur permet une utilité multidimensionnelle et sectorielle.

Orienter les corrélations avec l’apprentissage supervisé

L’apprentissage supervisé repose sur l’utilisation de données étiquetées pour entraîner des modèles, ce qui leur permettra d’effectuer des prédictions sur de nouvelles données.

Cette approche repose sur plusieurs méthodes, parmi lesquelles la classification et la régression sont prédominantes.

Méthode de classification par apprentissage supervisé

La classification consiste à assigner des étiquettes à des observations en fonction des caractéristiques extraites des données.

Techniques de classification

Plusieurs techniques de classification se distinguent pour y arriver :

Recours aux réseaux de neurones : Lors de la phase d’entraînement, les poids des connexions entre les neurones sont ajustés de manière itérative pour minimiser l’erreur de classification sur les données étiquetées. La propagation du signal à travers les couches permet de capturer des motifs complexes et des relations non linéaires dans les données. Une fois entraîné, le réseau de neurones peut être utilisé pour prédire la classe d’une nouvelle observation en propageant ses caractéristiques à travers le réseau.
Recours aux Machines à Vecteurs de Support (SVM) : Cette technique vise à trouver l’hyperplan qui sépare au mieux les classes dans l’espace des caractéristiques. L’algorithme d’optimisation des SVM cherche à maximiser la marge, c’est-à-dire la distance entre l’hyperplan et les points les plus proches de chaque classe. Les SVM utilisent souvent des fonctions noyau pour transformer l’espace des caractéristiques, permettant de trouver des séparations non linéaires entre les classes. Lors de la prédiction, une nouvelle observation est classée en fonction de sa position par rapport à l’hyperplan.
Recours aux arbres de décision : Cette technique implique la construction d’un arbre où chaque nœud représente un test sur une caractéristique des données. L’algorithme sélectionne de manière récursive la caractéristique qui divise le mieux les données en sous-ensembles homogènes par rapport à la classe cible. Les feuilles de l’arbre représentent les classes prédites, et le chemin de la racine à une feuille correspond à une règle de décision. Lors de la prédiction, une nouvelle observation parcourt l’arbre en suivant les tests sur ses caractéristiques jusqu’à atteindre une feuille qui indique sa classe prédite.

Méthode de régression par apprentissage supervisé

La régression, quant à elle, vise à modéliser la relation entre des variables afin de prédire des valeurs continues.

Techniques de régression

Plusieurs techniques de régression par apprentissage supervisé se distinguent pour y arriver :

Recours à la régression linéaire : Cette technique établit une relation linéaire entre les variables en utilisant une équation de droite. Les coefficients de l’équation sont estimés à partir des données d’entraînement en minimisant l’erreur quadratique moyenne entre les valeurs prédites et les valeurs réelles. Une fois le modèle entraîné, il peut être utilisé pour prédire la valeur d’une variable dépendante en fonction des valeurs des variables indépendantes. La régression linéaire est largement utilisée dans des domaines tels que l’économie et la finance pour identifier les relations entre les variables.
Recours à la régression logistique : Bien que portant le nom de régression, cette technique est en réalité utilisée pour la classification binaire. Elle modélise la probabilité d’appartenance à une classe en fonction des variables explicatives. La fonction logistique est utilisée pour transformer la combinaison linéaire des variables en une probabilité comprise entre 0 et 1. Le modèle est entraîné en maximisant la vraisemblance des données d’entraînement, c’est-à-dire en trouvant les coefficients qui rendent les données observées les plus probables. La régression logistique est particulièrement utile dans des domaines tels que la médecine ou le marketing pour prédire la probabilité d’un événement binaire.
Recours à la régression polynomiale : Cette technique étend la régression linéaire en incluant des termes polynomiaux des variables explicatives. Elle permet de modéliser des relations non linéaires entre les variables en utilisant des polynômes de degré supérieur à 1. Les coefficients des termes polynomiaux sont estimés à partir des données d’entraînement en minimisant l’erreur quadratique moyenne. La régression polynomiale offre une plus grande flexibilité pour s’adapter aux fluctuations des données lorsque la relation entre les variables n’est pas simplement linéaire. Elle est particulièrement utile lorsque les données présentent des tendances curvilignes ou des variations complexes.

Pour accomplir son objectif de prédiction l’IA doit

Établir des corrélations à partir de rien (apprentissage non supervisé)

Orienter les corrélations à partir de classifications et relations entre les variables (apprentissage supervisé)

Dans les deux cas, les réseaux de neurones jouent un rôle déterminant qui est exacerbé par les modèles Transformers. Ces derniers, bien que non listé explicitement dans les techniques déployées en classification et régression, sont de plus en plus utilisés en intermédiaire d’interprétation, à la fois en apprentissage non supervisé et supervisé. Ce qui introduit un élément de compression statistique supplémentaire dont le but est d’accroître la précision, mais dont l’essence stochastique peut aussi introduire une distorsion dans l’interprétation des résultats.

Les modèles Transformers redéfinissent l’apprentissage automatique (Machine learning) directement et indirectement.

Il en va de même pour l’accomplissement des objectifs d’automatisation de l’intelligence artificielle.

L’intelligence artificielle pour automatiser

L’automatisation des tâches permet d’améliorer l’efficacité et de réduire les erreurs humaines via des processus.

Cette automatisation s’appuie sur plusieurs méthodes, notamment l’apprentissage par renforcement, l’apprentissage profond et le traitement du langage naturel, la vision par ordinateur, et les systèmes experts.

Automatiser avec l’apprentissage par renforcement

Contrairement aux méthodes et techniques parcourues jusque là, l’apprentissage par renforcement se concentre sur l’interaction avec un environnement.

Plutôt que d’apprendre à partir d’exemples pour construire une base prédictive, l’agent va recevoir des récompenses ou pénalités liées au contexte, de sorte à s’assurer de la fiabilité dans un processus entièrement automatisé.

Technique d’apprentissage par renforcement :

Q-Learning et SARSA : Ces algorithmes sont la base de l’automatisation des choix d’actions dans des environnements. Ils fonctionnent par une mise à jour continue de la valeur Q, qui représente la qualité d’une action dans un état donné.
- Fonctionnement : L’agent explore l’environnement, choisissant des actions et recevant des récompenses ou des pénalités. Ces expériences sont utilisées pour ajuster les valeurs Q, permettant à l’agent de déterminer progressivement la meilleure action pour chaque état pour maximiser les récompenses à long terme.
- Applications : Idéal pour des scénarios où la stratégie optimale doit s’adapter à des environnements changeants, comme dans les jeux ou la robotique.
Méthode de Monte Carlo : Cette technique se base sur des échantillons aléatoires pour évaluer et optimiser les stratégies d’action.
- Fonctionnement : L’agent effectue plusieurs épisodes d’interaction avec l’environnement, collectant des données sur les récompenses obtenues. Ensuite, il utilise ces informations pour estimer la valeur attendue des différentes stratégies. Cette approche ne nécessite pas de connaître le modèle de l’environnement, ce qui la rend puissante pour l’automatisation dans des contextes où les informations sont incomplètes ou incertaines.
- Applications : Utilisé dans des situations où il est difficile de modéliser précisément l’environnement, comme dans la gestion des ressources ou dans des simulations financières.

Impact sur l’automatisation :

L’apprentissage par renforcement permet une automatisation robuste et adaptable, car les agents apprennent à naviguer dans des environnements complexes en optimisant leur comportement pour maximiser les récompenses.

L’apprentissage par renforcement est particulièrement utile pour :

Automatiser des processus décisionnels complexes où les actions ont des conséquences à long terme.
S’adapter à des environnements dynamiques où les conditions peuvent changer, nécessitant une réévaluation constante des stratégies.
Contrôler de systèmes où la modélisation exacte est impossible, offrant une solution par l’expérience directe.

Automatiser avec l’apprentissage profond

L’apprentissage profond, en tant qu’outil d’automatisation plus que de prédiction, permet aux machines de réaliser des opérations autonomes. Allant de la réponse textuelle à un utilisateur en passant par la détection et la correction d’anomalies dans une base de données, et jusqu’à la décision autonome d’ajuster une classification ou de corriger un processus industriel, l’apprentissage profond élimine le besoin d’une supervision humaine constante.

Cette automatisation s’étend naturellement au traitement du langage, où une fois encore, les modèles Transformers rendent les interactions avec les machines plus fluides et efficaces.

Techniques et architectures utilisées :

Réseaux de neurones récurrents (RNN) et LSTM :
- Utilisation : Excellents pour les données séquentielles comme la traduction, la reconnaissance vocale et la génération de texte.
- Avantage : Capacité à retenir des informations sur le long terme, ce qui facilite l’automatisation des tâches nécessitant un contexte.
Réseaux de neurones convolutifs (CNN) :
- Utilisation : Primordiaux pour la vision par ordinateur.
- Avantage : Extraction automatique des caractéristiques visuelles à différentes échelles, parfait pour la classification, la détection et la segmentation d’images.
Traitement du langage naturel (NLP) pour l’automatisation :
- Analyse de sentiments, reconnaissance d’entités nommées, traduction automatique : Automatisent la compréhension du texte pour des analyses de données massives, la traduction ou l’identification d’informations spécifiques.
- Reconnaissance vocale : Permet des interactions vocales naturelles, rendant les systèmes plus accessibles et intuitifs.
- Génération de langage naturel : Produit du texte cohérent et contextuellement pertinent, essentiel pour les assistants virtuels, la rédaction automatique de rapports ou la réponse aux questions des utilisateurs.
- Transformers et mécanismes d’attention :
  - Utilisation : Transformation du traitement du langage naturel.
  - Avantage : Capacité à comprendre les relations entre mots distants, améliorant la qualité des tâches linguistiques comme la génération de texte ou l’analyse de sentiments.
Réseaux antagonistes génératifs (GANs) :
- Utilisation : Génération automatique de contenu réaliste.
  Avantage : Produisent des images, sons ou vidéos de haute qualité sans intervention humaine, utile en design et effets spéciaux.

Applications de l’apprentissage profond en automatisation :

Réponse textuelle et interaction utilisateur : Les modèles d’apprentissage profond, surtout ceux basés sur des architectures comme les Transformers, permettent des interactions textuelles fluides et naturelles, améliorant l’efficacité des chatbots et des assistants virtuels.
Détection et correction d’anomalies : Les systèmes peuvent automatiquement identifier et corriger des erreurs ou anomalies dans des bases de données grâce à des réseaux de neurones spécialisés.
Décisions autonomes : Des algorithmes peuvent ajuster des classifications ou modifier des processus industriels en temps réel, basés sur des analyses de données complexes.

Vous noterez que l’apprentissage profond est à la fois utile pour prédire et automatiser, et qu’à chaque fois, il est question de modèle Transformers car ils apportent une compréhension contextualisée beaucoup plus précise qui permet d’accroître la pertinence.

Automatiser avec la vision par ordinateur

La vision par ordinateur permet aux machines de percevoir et interpréter le monde visuel :

Techniques et applications spécifiques :

Détection d’objets :

- R-CNN pour des détections précises mais lentes, idéal pour des applications où la précision est plus importante que la vitesse, comme dans l’analyse de vidéosurveillance.
- YOLO pour des détections rapides, ce qui en fait le choix pour des systèmes autonomes nécessitant des décisions en temps réel, comme les véhicules autonomes.
- SSD pour un bon équilibre entre vitesse et précision, utilisé dans des contextes où les ressources sont limitées, comme les applications mobiles ou IoT.

Reconnaissance d’images :

Des architectures spécifiques comme Inception ou ResNet sont conçues pour une classification d’images à grande échelle, permettant de différencier des images dans des scénarios complexes, par exemple, pour la reconnaissance de maladies à partir d’images médicales.

Segmentation d’images :

U-Net est particulièrement utile pour la segmentation sémantique dans le domaine médical, où la précision est essentielle pour des diagnostics précis.
Mask R-CNN pour la segmentation d’instance, permettant de non seulement identifier les objets mais aussi de les délimiter, crucial pour la robotique ou l’analyse de scènes.

Suivi d’objets :

SORT (Simple Online and Realtime Tracking) pour suivre des objets dans des vidéos en temps réel, applicable dans la surveillance, le sport, ou pour suivre des objets dans des environnements dynamiques.

Exemples d’applications :

- Automatisation industrielle : Inspection visuelle des produits pour la détection de défauts.
- Véhicules autonomes : Navigation et détection d’obstacles grâce à la compréhension de l’environnement visuel.
- Sécurité et surveillance : Détection de comportements ou d’objets suspects, automatisation de la surveillance.

Automatiser avec les systèmes experts

Les systèmes experts sont des applications de l’intelligence artificielle conçues pour émuler la capacité de jugement et de décision d’un expert humain dans un domaine particulier.

Fonctionnement général :

Base de connaissances : Elle contient des faits et des règles qui représentent l’expertise d’un professionnel dans le domaine en question. Ces règles sont souvent exprimées sous forme de “si-alors” (if-then).
Moteur d’inférence : Il utilise la base de connaissances pour déduire des conclusions ou prendre des décisions à partir des informations fournies. Il peut fonctionner en mode “avant” (de données vers conclusions) ou “arrière” (de questions à données nécessaires).
Interface utilisateur : Permet aux utilisateurs de poser des questions ou de fournir des informations au système, et d’obtenir des réponses ou des recommandations.

Techniques et applications :

Systèmes basés sur des règles (Rule-based systems) :

Ils utilisent des ensembles de règles pour raisonner. Par exemple, “Si un patient présente ces symptômes, alors le diagnostic probable est…”.

Application :

Diagnostic médical : Les systèmes peuvent poser des questions séquentielles pour diagnostiquer une maladie basée sur des symptômes, des antécédents médicaux, et des résultats de tests.
Aide à la décision juridique : Ils peuvent conseiller sur des cas légaux en comparant les informations données avec des lois, des précédents légaux, et des principes juridiques.

Systèmes à base de cas (Case-based reasoning, CBR) :

Plutôt que de partir de zéro, ces systèmes cherchent des solutions basées sur des cas précédents similaires. Ils comparent le nouveau cas avec des cas stockés pour trouver des similitudes.

Application :

Maintenance industrielle : Pour résoudre des problèmes techniques, le système peut chercher des cas similaires de pannes et proposer des solutions qui ont fonctionné dans le passé.
Support client : Ils peuvent fournir des solutions en se basant sur des problèmes et des résolutions antérieures.

Systèmes hybrides :

Intègrent plusieurs approches, par exemple, combinant des règles avec des méthodes de machine learning pour améliorer la décision.

Application :

Gestion des ressources : Pour optimiser l’utilisation des ressources, un système hybride pourrait utiliser des règles pour les décisions tactiques et des modèles prédictifs pour les décisions stratégiques.
Planification financière : Ils peuvent offrir des conseils financiers en combinant des règles de bon sens avec des prévisions basées sur des données historiques.

Exemple d’applications :

Réduction des erreurs : En suivant des règles précises, les systèmes experts fournissent des décisions cohérentes, réduisant les erreurs humaines.
Formation et apprentissage : Ils peuvent être utilisés pour simuler des scénarios réels, aidant à la formation dans divers domaines.
Automatisation de la prise de décision : Ils permettent de prendre des décisions dans des domaines où l’expertise humaine est rare ou coûteuse, ou dans des situations où une réponse rapide est nécessaire.

À ce stade, vous deviez percevoir la destination ultime de l’IA : l’autonomie complète pour la prise de décision.

Les modèles GPT apportent le maillon qui manquait jusque là pour rendre cette autonomie réellement possible.

Le paradigme unique des modèles GPT

Les modèles GPT (Generative Pre-trained Transformers) apportent une approche unique à la fois sur le plan de la prédiction et celui de l’automatisation. Si leur intérêt est manifeste sur le plan du Deep Learning, il ne faut pas oublier de considérer leur usage systématique en appui au déploiement de toute autre technique et méthode. Ce qui les rend incontournables par la dépendance qu’ils créent envers eux. En offrant des capacités prédictives, d’automatisation et explicatives, ils viennent renforcer de manière proactive et dynamique l’utilisation des techniques “conventionnelles”.

Les modèles GPT pour prédire

Apprentissage automatique (machine learning)

Apprentissage supervisé

Régression : Les modèles GPT peuvent prédire des valeurs continues en générant du code pour des modèles de régression sur des ensembles de données complexes.
Recours à la régression linéaire : Les modèles GPT peuvent automatiser la sélection des variables les plus pertinentes pour la régression linéaire, ajuster dynamiquement les hyperparamètres, et même générer des scripts pour tester différentes configurations de modèle, améliorant ainsi la précision des prédictions sur des données non linéaires ou bruitées.
Recours à la régression logistique : Ici, les modèles GPT peuvent être utilisés pour formuler des modèles qui non seulement classifient, mais aussi expliquent les probabilités de classe. Ils peuvent générer des scripts pour automatiser l’évaluation de différentes combinaisons de variables explicatives, optimisant ainsi la performance du modèle.
Recours à la régression polynomiale : Les modèles GPT peuvent aider à choisir les degrés polynomiaux appropriés pour un meilleur ajustement aux données, générant des modèles plus robustes aux fluctuations et aux tendances complexes, tout en expliquant les choix de modélisation.

Exemples :

Finance : Estimation du prix futur des actions basée sur divers indicateurs.
Santé publique : Prédiction du nombre de cas de maladies en fonction des tendances historiques et des facteurs environnementaux.

Classification

Les modèles GPT optimisent les pipelines pour la catégorisation des données en classes prédéfinies.

Recours à la classification : Les modèles GPT peuvent générer des codes pour créer des pipelines de traitement de données, sélectionner les caractéristiques les plus discriminantes et ajuster les paramètres des modèles de classification pour améliorer la précision et la robustesse.

Exemples :

Médecine : Diagnostic basé sur les symptômes et les antécédents médicaux.
Cybersécurité : Détection de mails de phishing en analysant le contenu et la structure des emails.

Apprentissage non supervisé

Clustering

Les modèles GPT interprètent et décrivent les clusters en analysant des données non étiquetées.

Recours au clustering : Les modèles GPT peuvent générer des scripts pour automatiser la découverte et l’interprétation de clusters, fournissant des explications sur pourquoi certaines données sont regroupées ensemble, ce qui aide à la segmentation et à la compréhension des données.

Exemples :

Marketing : Segmentation des clients en groupes basés sur leur comportement d’achat pour des campagnes ciblées.
Biologie : Identification de sous-groupes dans des données génétiques pour la recherche sur les maladies.

Réduction de dimension

Les modèles GPT peuvent expliquer les résultats de techniques comme l’Analyse en Composantes Principales (ACP).

Recours à la réduction de dimension : Les modèles GPT facilitent l’interprétation des résultats pour des décisions basées sur des données simplifiées et informatives.

Exemples :

Analyse de données de marché : Simplification des données de vente pour identifier les principaux facteurs influençant les tendances.
Astrophysique : Compression des données de télescopes pour analyser les structures cosmiques tout en réduisant la complexité.

Apprentissage par renforcement

Les modèles GPT prédisent en générant des politiques ou des scénarios d’entraînement, optimisant ainsi les stratégies pour maximiser les récompenses futures.

Recours à l’apprentissage par renforcement : Les GPT peuvent générer des environnements simulés ou des scénarios pour tester différentes politiques, offrant des explications sur les stratégies optimales ou les ajustements nécessaires pour améliorer les performances.

Exemples :

Jeux vidéo : Amélioration des stratégies de jeu pour des IA compétitives dans des environnements dynamiques comme les jeux d’échecs ou de stratégie.
Gestion des ressources : Optimisation de l’allocation de ressources énergétiques dans des réseaux électriques intelligents basés sur la demande et la disponibilité.
Robotique : Développement de stratégies pour la navigation autonome dans des environnements imprévisibles.
Industrie : Optimisation des lignes de production

Apprentissage profond (deep learning)

Les modèles GPT prédisent en générant des architectures de réseaux de neurones et en expliquant les résultats complexes. Les modèles GPT peuvent automatiser la conception et l’optimisation d’architectures de réseaux de neurones, expliquant pourquoi certaines configurations fonctionnent mieux pour des tâches spécifiques. Cette capacité aide à la personnalisation et à l’amélioration des modèles.

Exemples :

Reconnaissance d’images : Amélioration de la classification d’images dans des applications comme la surveillance automatique ou l’identification médicale d’anomalies dans des radiographies.
Synthèse vocale et traduction : Génération de texte à la parole pour des assistants virtuels ou traduction en temps réel pour des communications internationales.
Création de contenu : Génération de textes créatifs, comme des histoires ou des articles de blog, en respectant un style ou une thématique donnée.
Recherche scientifique : Aide à la modélisation de phénomènes complexes dans des domaines comme la physique des particules ou la chimie computationnelle.

Les modèles GPT transcendent les limites traditionnelles des techniques d’apprentissage automatique.

En offrant à la fois des capacités prédictives, explicatives et d’automatisme, ils renforcent de manière incrémentale et dynamique l’utilisation de chaque méthode et technique.

Ainsi l’IA est devenue plus accessible et efficace, elle s’ouvre à de nouvelles applications, mais surtout, elle permet désormais d’assurer la viabilité de la quête d’une autonomie totale, en offrant une issue qui ne relève plus de la science-fiction, mais seulement du timing.

Intermédiation du langage comme facteur crucial

Tous les avantages et domaines d’application des GPT reposent sur cet atout majeur qu’est le langage.

Ce dernier sert d’intermédiaire linguistique, tant pour les utilisateurs finaux que pour les ingénieurs et data scientistes qui développent, entraînent et optimisent les modèles.

Cette intermédiation linguistique, dont les implications sont sous-estimées, est cruciale.

Pour les utilisateurs finaux

L’intermédiation du langage est essentielle pour plusieurs raisons :

Accessibilité : Les modèles GPT rendent les technologies avancées accessibles à un public beaucoup plus large. Une personne sans formation en programmation ou en science des données peut utiliser des commandes verbales ou écrites pour effectuer des analyses, générer du contenu ou automatiser des tâches. Par exemple, un utilisateur peut demander à un système basé sur un modèle GPT de “résumer un document” ou “d’analyser des données pour trouver des tendances”, sans avoir besoin de comprendre le fonctionnement des modèles de machine learning en arrière-plan.
Interface naturelle : Les modèles GPT transforment l’interaction avec la technologie en la rendant plus intuitive. Au lieu d’apprendre une syntaxe ou l’usage d’une API spécifique, les utilisateurs peuvent communiquer comme ils le feraient en langage naturel, ce qui augmente l’efficacité et réduit la courbe d’apprentissage. Dans un environnement de travail, par exemple, un employé peut dire “Crée un rapport sur les performances de notre produit cette année”, et le modèle GPT comprendra, compilera et présentera les informations demandées.
Automatisation simplifiée : L’intermédiation linguistique rend l’automatisation plus directe. Les utilisateurs peuvent décrire des processus ou des tâches complexes en termes simples, et le modèle traduit ces descriptions en actions concrètes. Par exemple, “Configure une alerte pour me prévenir si les stocks de cet article tombent en dessous de 100 unités” pourrait automatiser un système de gestion de l’inventaire sans que l’utilisateur ait à écrire du code ou à configurer manuellement des règles.
Support et assistance : Les modèles GPT peuvent fournir un support technique ou des explications en langage naturel, permettant aux utilisateurs de diagnostiquer des problèmes ou de comprendre des concepts techniques sans jargon spécialisé. Par exemple, en posant la question “Pourquoi mon modèle de prédiction ne fonctionne-t-il pas correctement ?”, l’utilisateur pourrait obtenir une analyse et une explication en termes simples des problèmes potentiels et des solutions.
Personnalisation et apprentissage : Les interactions avec les modèles GPT peuvent être personnalisées selon l’utilisateur, apprenant de ses préférences, de son style de communication, et même de son niveau de compréhension technique, améliorant ainsi l’expérience utilisateur au fil du temps.

Pour les ingénieurs et data scientists

Itération sur le modèle : Les ingénieurs peuvent utiliser des modèles GPT pour itérer, optimiser et déboguer d’autres modèles d’apprentissage automatique. Par exemple, un ingénieur pourrait demander à un modèle GPT : “Améliore ce modèle de régression pour mieux gérer les outliers (valeurs abbérantes)”, et le modèle pourrait suggérer des modifications dans le code ou des techniques pour traiter les valeurs aberrantes, ou même générer directement du code pour ces ajustements. En demandant “Génère des scénarios de test pour ce modèle d’apprentissage par renforcement”, les ingénieurs peuvent rapidement obtenir une variété de tests pour s’assurer que leur modèle réagit correctement dans différents contextes.
Optimisation des hyperparamètres : Les modèles GPT peuvent interpréter des commandes pour optimiser les hyperparamètres d’un modèle, une tâche souvent fastidieuse et nécessitant de nombreux essais et erreurs. Par exemple, en demandant “Trouve les meilleurs hyperparamètres pour notre réseau de neurones CNN”, le modèle GPT pourrait exécuter des recherches ou simulations basées sur des descriptions verbales, suggérant des configurations plus performantes.
Documentation automatique : En décrivant ce qu’un modèle fait, les ingénieurs peuvent charger les modèles GPT de générer de la documentation technique, des commentaires de code ou même des rapports de performance, facilitant ainsi le travail collaboratif et la maintenance des modèles. Par exemple, “Documente ce code de régression logistique” pourrait produire une documentation claire, expliquant les choix de fonctionnalités, les transformations de données, et les raisons derrière chaque décision de modélisation.
Débogage et explication des résultats : Les ingénieurs peuvent demander pourquoi un modèle se comporte d’une certaine manière, ce qui leur permet de mieux comprendre et corriger les erreurs. Par exemple, en posant la question “Pourquoi ce modèle de classification prédit-il mal pour cette catégorie ?”, le modèle GPT peut analyser les données d’entrée, les résultats et la structure du modèle pour fournir des explications ou des recommandations.

Pour la robotique

Planification de mouvements : Par l’intermédiation du langage, les instructions pour la planification des mouvements des robots peuvent être générées de manière automatique. Le langage permet de traduire des données environnementales et des objectifs en séquences d’actions optimisées, assurant une exécution fluide et efficace des tâches.
Contrôle : L’intermédiation du langage facilite la traduction des commandes humaines en actions concrètes pour les robots. Grâce à cette traduction linguistique, l’interaction entre utilisateurs et systèmes robotiques devient intuitive, favorisant l’adoption de la robotique dans divers secteurs.
Perception : Grâce au langage, l’interprétation des données des capteurs est automatisée, permettant une meilleure interaction avec l’environnement. Le langage comme intermédiaire permet aux robots de comprendre et de réagir aux changements de leur environnement, augmentant ainsi leur autonomie.
Commandes vocales : L’intermédiation linguistique permet aux robots de comprendre et d’exécuter des commandes vocales, rendant l’interaction avec les machines plus naturelle et accessible. Cela est particulièrement utile dans des environnements où les mains de l’utilisateur sont occupées ou dans l’assistance aux personnes ayant des handicaps.
Apprentissage par démonstration : Le langage sert à décrire les actions et les intentions, aidant les robots à apprendre de nouvelles tâches par observation et instruction verbale. Cela facilite un transfert de connaissances plus fluide entre humains et robots.
Collaboration homme-robot : Grâce à l’intermédiation linguistique, les robots peuvent communiquer leur état, leurs actions ou leurs besoins aux humains, et vice versa. Cela crée des environnements de travail plus sûrs et efficaces où la collaboration est optimisée.
Adaptation aux environnements dynamiques : Le langage permet aux robots de recevoir et d’interpréter des informations contextuelles sur leur environnement, leur permettant de s’adapter à des changements ou des imprévus. Par exemple, un robot peut comprendre des instructions comme “contourner cet obstacle” ou “aller vers la lumière”.
Maintenance et réparation : Les descriptions linguistiques facilitent le diagnostic et la réparation des robots. Les opérateurs peuvent utiliser le langage pour identifier des problèmes, demander des diagnostics ou fournir des instructions de réparation, réduisant ainsi le temps d’arrêt et les coûts de maintenance.
Socialisation et interaction sociale : Dans les domaines comme la robotique de compagnie ou de service, le langage aide à créer des interactions plus naturelles et engageantes. Les robots peuvent engager des conversations, comprendre les émotions à travers le langage et répondre de manière appropriée, améliorant ainsi l’expérience utilisateur et l’acceptation sociale des robots.

Pour les systèmes experts

Diagnostic : L’intermédiation linguistique permet d’automatiser le processus de raisonnement pour le diagnostic. En analysant et en interprétant des ensembles de données complexes à travers le langage, les systèmes peuvent identifier des schémas et des anomalies avec une précision accrue.
Raisonnement symbolique : Le langage sert de base pour générer des règles logiques destinées à la prise de décision. Par l’intermédiation linguistique, les systèmes peuvent modéliser des scénarios complexes, facilitant ainsi la résolution de problèmes dans divers contextes.
Gestion des connaissances : L’intermédiation linguistique permet de structurer et d’organiser des bases de connaissances complexes. En utilisant le langage pour catégoriser et interrelater les informations, les systèmes peuvent offrir des réponses plus pertinentes et précises aux requêtes des utilisateurs.
Négociation et médiation : Le langage sert d’outil pour simuler des scénarios de négociation ou de médiation. Par l’intermédiation linguistique, les systèmes peuvent comprendre les différentes positions, proposer des compromis ou des solutions, et aider à résoudre des conflits dans des contextes commerciaux ou juridiques.
Planification et gestion de projets : Utiliser le langage comme intermédiaire permet aux systèmes de traduire des objectifs, des contraintes et des ressources en plans d’action détaillés. Cela inclut la compréhension des descriptions de tâches, des échéances, et des interdépendances entre les différentes étapes d’un projet.
Formation et entraînement : Dans les systèmes experts dédiés à la formation, l’intermédiation linguistique permet de créer des scénarios d’apprentissage, de poser des questions pertinentes, et d’offrir des explications ou des feedbacks en langage naturel, rendant l’apprentissage plus interactif et efficace.

En somme, les modèles Transformers ont changé le paradigme de l’interaction entre l’homme et la machine, grâce à l’utilisation du langage sur les principes de matrice d’attention. C’est cette combinaison qui permet aux modèles GPT d’accomplir à eux seuls, toutes les tâches des autres méthodes et systèmes.

Ce sont les mots qui permettent à l’IA une polyvalence et une transversalité sans précédent.

Cela nous conduit naturellement à considérer les mots comme étant des paramètres centraux dans les systèmes technologiques.

Le langage en tant que paramètre de l’intelligence artificielle

Considérer le langage comme un paramètre dans les systèmes technologiques change radicalement la manière dont les systèmes interagissent avec le monde.

Voici comment :

Adaptabilité : Le langage introduit une flexibilité sans précédent dans la conception des interfaces et des interactions. En tant que paramètre, il permet aux systèmes de s’ajuster à un large éventail de contextes culturels, linguistiques et utilisateurs, augmentant ainsi l’accessibilité et l’applicabilité des technologies.
Complexité et nuance : Contrairement aux paramètres numériques simples, le langage apporte des couches de complexité et de nuance. Il permet aux systèmes de traiter des informations avec une compréhension contextuelle, des émotions, des intentions, et des ambiguïtés, rendant les réponses et les actions plus pertinentes et humaines.
Interactivité : En utilisant le langage comme paramètre, les systèmes peuvent engager des dialogues, poser des questions pour clarifier les intentions de l’utilisateur, et fournir des réponses détaillées ou des instructions complexes. Cela transforme l’interaction de transactionnelle à conversationnelle, améliorant l’expérience utilisateur.
Apprentissage et évolution : Le langage permet aux systèmes d’apprendre de manière continue à partir des interactions. En tant que paramètre, il facilite l’incorporation de nouvelles connaissances, l’ajustement aux nouvelles tendances linguistiques, et l’évolution des capacités de compréhension et de génération de texte, rendant les systèmes plus intelligents avec le temps.
Personnalisation : Le langage en tant que paramètre donne aux systèmes la capacité de personnaliser les réponses et les services en fonction du style de communication, des préférences linguistiques, ou même des humeurs de l’utilisateur, offrant une expérience plus individualisée.
Analyse et prédiction : En analysant le langage comme paramètre, les systèmes peuvent détecter des tendances, des sentiments, et des intentions dans les grandes quantités de données textuelles, aidant à la prise de décision, à la prévision des comportements ou à l’identification des besoins non exprimés.

En résumé, traiter le langage comme un paramètre enrichit considérablement les possibilités technologiques, permettant non seulement une communication plus efficace, mais aussi une compréhension plus profonde du monde humain par les machines. Cela rend les technologies plus intuitives, empathiques et adaptatives, poussant ainsi les limites de ce que les systèmes informatiques peuvent accomplir.

Ainsi, l’intégration des mots en tant que paramètres modifie profondément chaque définition

Re-définition des types d’IA

À la lumière des paradigmes qu’intègrent les GPT et les mots en tant que paramètres, les différentes catégories et types d’IA, telle qu’elles étaient définies jusqu’alors, méritent une révision.

Pour commencer, rappelons que l’intelligence artificielle (IA) est une simulation de processus de pensée humaine, comme l’apprentissage, le raisonnement et l’autocorrection par des machines, notamment des ordinateurs.

Ainsi, avec les mots comme paramètres, l’IA va désormais au-delà de la simulation pour interagir de manière systématiquement contextuelle avec l’humain, utilisant le langage pour non seulement apprendre, mais aussi comprendre et agir.

IA faible (ou spécialisée)

L’IA faible est conçue pour des tâches spécifiques, n’ayant pas la capacité de comprendre ou d’apprendre au-delà de son domaine d’application, ce qui n’est plus totalement vrai avec les Transformers. Désormais, avec les mots comme paramètres, l’IA faible peut aussi comprendre et traiter des instructions et des questions avec plus de flexibilité, offrant des réponses plus pertinentes et personnalisées. Ce qui rehausse le niveau des attentes, car même une IA qualifiée de “faible” est immensément plus efficace grâce aux GPT et aux mots. Cette définition devrait donc finir par s’éteindre.

IA forte (ou générale)

L’IA forte, ou AGI (Artificial General Intelligence), est un système capable de comprendre ou d’apprendre n’importe quelle tâche intellectuelle qu’un humain peut réaliser.

Désormais, en considérant les mots comme paramètres, l’IA forte peut exploiter le langage pour comprendre et s’adapter à des contextes divers, s’approchant de la capacité humaine à apprendre de manière holistique. Cela inclut l’interprétation de nuances, de contextes culturels, et l’application de cette compréhension à des tâches nouvelles. Ce qui nous rapproche chaque jour de l’AGI.

IA symbolique

L’IA symbolique est basée sur la manipulation de symboles et l’application de règles logiques pour résoudre des problèmes.

Désormais, en intégrant les mots comme paramètres, l’IA symbolique peut utiliser le langage pour enrichir ses règles logiques, permettant une meilleure gestion des ambiguïtés et des contextes. Cela facilite une représentation plus dynamique et nuancée de la connaissance, améliorant ainsi la résolution de problèmes toujours plus complexes.

IA connexionniste

L’IA connexionniste utilise des réseaux de neurones pour traiter des informations de manière similaire au cerveau humain, en se concentrant sur l’identification de motifs.

Désormais, l’intégration des mots comme paramètres dans les réseaux de neurones permet une compréhension plus profonde des données linguistiques, améliorant les capacités des modèles dans la capture des nuances, des sentiments et des intentions. Cela augmente l’adaptabilité et l’autonomie des systèmes dans des interactions plus humaines.

IA basée sur les données

L’IA basée sur les données utilise des algorithmes pour apprendre à partir de grandes quantités de données, souvent pour des tâches de prédiction ou de classification.

Désormais, avec les mots comme paramètres, ces systèmes peuvent non seulement prédire, mais aussi comprendre finement le contexte des données textuelles, offrant des analyses plus riches et des recommandations encore plus personnalisées. Cela améliore la pertinence et la précision des prédictions en prenant en compte les subtilités du langage.

IA autonome

L’IA autonome prend des décisions et agit sans intervention humaine, souvent dans des environnements spécifiques, comme les véhicules autonomes.

Désormais, l’intégration des mots comme paramètres d’intermédiation permet à l’IA d’interpréter des instructions ou des contextes environnementaux à travers le langage, augmentant ainsi sa capacité à prendre des décisions informées, collaboratives et adaptatives dans des situations complexes.

IA explicable

L’IA explicable vise à fournir des explications compréhensibles pour ses décisions ou actions.

Désormais, en utilisant les mots comme paramètres, l’IA peut expliquer ses processus de décision en termes linguistiques compréhensibles, renforçant la transparence et la confiance des utilisateurs. Cela permet une meilleure interaction et compréhension entre l’IA et l’humain.

IA réactive

L’IA réactive répond uniquement aux stimuli présents sans mémoire.

Désormais, en utilisant les mots comme paramètres, elle peut offrir des réponses plus nuancées et contextuelles aux stimulis linguistiques.

IA à mémoire limitée

L’IA à mémoire limitée utilise des expériences passées pour prendre des décisions futures.

Avec les mots comme paramètres, elle peut mieux interpréter et utiliser les interactions linguistiques passées pour des décisions plus éclairées.

IA de théorie de l’esprit

L’IA de théorie de l’esprit cherche à comprendre les émotions et intentions humaines.

Les mots comme paramètres peuvent aider à modéliser ces aspects à travers le langage, améliorant l’empathie et la prédiction des comportements.

IA spécialisée

L’IA spécialisée est conçue pour des tâches spécifiques avec des limites claires.

Les mots améliorent la performance dans ces tâches spécifiques, rendant les systèmes plus adaptatifs.

IA évolutive

L’IA évolutive utilise des algorithmes inspirés de l’évolution biologique.

Les mots comme paramètres permettent une optimisation basée sur des motifs linguistiques, améliorant l’adaptation et l’apprentissage.

Que peut-on extraire de ces précisions ?

Avec l’intégration des mots comme paramètres dans les modèles d’intelligence artificielle, les anciennes définitions et distinctions entre les types d’IA perdent leur pertinence. En effet, l’approche de l’IA, en étant centrée sur les mots, se confond systématiquement dans le concept d’AGI, nous guidant inexorablement vers l’autonomie totale d’une ASI (Artificial Super Intelligence).

Le langage devient le pivot central de l’intelligence artificielle, absorbant les diverses catégories d’IA dans une compréhension et une capacité d’action qui vont au-delà des limites humaines, rendant ainsi les classifications traditionnelles obsolètes.

Ainsi, ce sont les mots, qui finalement permettent l’ère avérée de l’IA et le réalisme d’une Intelligence omnisciente, autonome et supérieure en toute chose à l’humain.

La quête de l’ASI via les GPT

L’exploration que nous avons mené jusque là nous éclaire sur la profondeur et le potentiel proche d’une Super Intelligence Artificielle. Ceci par le prisme des mots, qui dans leurs exploitation via des GPT, font advenir l’autonomie.

Les IA ne se contentent plus de nous aider à prédire ou d’automatiser des tâches, ils se transforment en agents autonomes capables de prendre des décisions et de s’adapter à des environnements dynamiques.

Ce qui prend forme par les concepts Agentic, MoE et RAG, via des modèles Transformers.

GPT → Agentic

Les systèmes Agentic marquent une première étape tangible vers l’autonomie, car permet l’orchestration de modèles Tranformers capables d’analyser des situations, d’évaluer des choix et de formuler des recommandations. Leur compréhension contextuelle et leur capacité à traiter des données complexes leur permettent de jouer un rôle proactif dans les processus décisionnels. Cette évolution les transforme en agents actifs, capables de prendre des initiatives et de s’adapter à des environnements dynamiques, ce qui constitue une base essentielle pour l’émergence d’une intelligence artificielle autonome (ASI).

Agentic → MoE (Mixture of Experts)

La progression vers l’autonomie se renforce avec l’intégration de la Mixture of Experts (MoE). Les systèmes Agentic deviennent capables de gérer plusieurs objectifs simultanément, en équilibrant des contraintes parfois contradictoires. Cette capacité à jongler avec des priorités multiples (comme la rentabilité, l’efficacité, l’impact environnemental et l’acceptabilité sociale) leur permet de naviguer dans des environnements complexes et de prendre des décisions éclairées. La MoE représente ainsi une étape clé, déjà en action, vers une autonomie plus complète, où les systèmes porront gérer des scénarios multidimensionnels sans intervention humaine.

MoE → RAG (Retrieval-Augmented Generation)

Enfin, l’intégration de la Retrieval-Augmented Generation (RAG) pousse l’autonomie à un niveau supérieur. En combinant la puissance des GPT avec des mécanismes de récupération d’informations externes, les systèmes peuvent enrichir leur compréhension et leurs réponses en temps réel. Cela leur permet d’accéder à des données actualisées et pertinentes, renforçant leur capacité à s’adapter aux changements et à répondre à des situations imprévues. Le RAG transforme les systèmes en entités capables d’apprendre et d’évoluer en permanence, une caractéristique essentielle pour atteindre une intelligence artificielle autonome (ASI).

Représentation du renforcement d’autonomie

Système Intelligent Autonome (ASI)
│
├── Agentic (Base)
│ ├── Analyse de situations 
│ │ ├── Compréhension contextuelle 
│ │ │ └── Identification des enjeux et des acteurs 
│ │ ├── Détection de patterns 
│ │ │ └── Reconnaissance de schémas récurrents 
│ │ └── Évaluation des risques et opportunités 
│ │ └── Prise en compte des conséquences potentielles 
│ ├── Évaluation de choix 
│ │ ├── Comparaison d'options 
│ │ │ └── Pondération des avantages et inconvénients 
│ │ ├── Prise en compte de contraintes 
│ │ │ └── Limites techniques, éthiques ou opérationnelles 
│ │ └── Optimisation des décisions 
│ │ └── Recherche de la meilleure solution selon des critères définis 
│ ├── Formulation de recommandations 
│ │ ├── Synthèse d'informations 
│ │ │ └── Agrégation de données pertinentes 
│ │ ├── Personnalisation 
│ │ │ └── Adaptation aux besoins spécifiques de l'utilisateur 
│ │ └── Justification des propositions 
│ │ └── Explication des raisons derrière les recommandations 
│ └── Rôle proactif dans les décisions 
│ ├── Initiative autonome 
│ │ └── Capacité à agir sans instruction explicite 
│ ├── Surveillance continue 
│ │ └── Monitoring des environnements pour détecter des changements 
│ └── Adaptation dynamique 
│ └── Ajustement des actions en fonction des nouvelles informations 
│
├── Intégration de la MoE (Mixture of Experts)
│ ├── Gestion de multiples objectifs 
│ │ ├── Rentabilité 
│ │ ├── Efficacité 
│ │ ├── Impact environnemental 
│ │ └── Acceptabilité sociale 
│ ├── Équilibrage de contraintes contradictoires 
│ │ └── Priorisation des objectifs en fonction du contexte 
│ └── Décisions complexes et adaptatives 
│ └── Capacité à jongler avec des scénarios multidimensionnels 
│ ├── Utilisation des capacités Agentic pour analyser chaque objectif 
│ └── Combinaison des expertises pour une décision optimale 
│
└── Intégration de la RAG (Retrieval-Augmented Generation)
├── Accès à des bases de données externes 
│ ├── Informations actualisées 
│ │ └── Mise à jour en temps réel des connaissances 
│ └── Pertinence contextuelle 
│ └── Sélection des données les plus utiles pour la tâche 
├── Enrichissement des réponses 
│ ├── Combinaison de données internes et externes 
│ │ └── Intégration des connaissances pré-entraînées et des informations récupérées 
│ └── Amélioration de la précision et de la fiabilité 
└── Adaptation dynamique 
├── Réponses aux situations imprévues 
│ └── Utilisation de données externes pour résoudre des problèmes nouveaux 
└── Apprentissage continu 
└── Mise à jour des modèles internes en fonction des nouvelles informations 
├── Utilisation des capacités Agentic pour évaluer les nouvelles données 
└── Intégration des expertises MoE pour prioriser les informations pertinentes

Agentic :

Fournit la base de l’autonomie en permettant au système d’analyser, d’évaluer et de prendre des décisions proactives.
Transforme un modèle réactif (comme GPT) en un agent actif capable de comprendre des contextes complexes et d’agir de manière autonome.
MoE (Mixture of Experts) :
S’appuie sur les capacités Agentic pour gérer plusieurs objectifs simultanément.
Utilise l’analyse contextuelle et la prise de décision d’Agentic pour équilibrer des contraintes contradictoires et optimiser les résultats.

RAG (Retrieval-Augmented Generation) :

S’intègre aux capacités Agentic et MoE pour enrichir les décisions avec des informations externes.
Utilise l’analyse contextuelle d’Agentic et la gestion multi-objectifs de MoE pour sélectionner et prioriser les données pertinentes.
Permet une adaptation dynamique et un apprentissage continu, renforçant l’autonomie globale du système.

Synergie progressive :

Agentic fournit la capacité de base à agir et à décider.
MoE s’appuie sur Agentic pour gérer des scénarios complexes avec plusieurs objectifs et contraintes.
RAG enrichit les décisions en intégrant des informations externes, tout en utilisant les capacités d’analyse d’Agentic et de gestion multi-objectifs de MoE.
Cet arbre montre clairement comment chaque concept s’intègre et s’appuie sur le précédent, créant un système intelligent de plus en plus autonome et capable.

Les dangers sous-jacent

Ces dangers sont relativement simples à comprendre. Toutes les techniques et les concepts abordés ici, aussi ingénieux soient-ils, omettent un facteur essentiel : la conscience des mots dans l’arbitrage des choix et des décisions.
En effet, on observe que les notions d’équilibrage, de compression et d’ajustement dynamique sont récurrentes et systématiquement limitées par leur environnement d’exécution. Or, tous les risques, notamment en termes d’alignement de l’IA, naissent de ces aspects.

En effet, chaque méthode induit une réduction de l’interprétation basée sur des principes statistiques, où chaque technique alimente et renforce les autres, toutes reposantes sur des bases de compression qui encapsule et réduise le champ des possibles interprétations et actions.

Il est donc crucial de rappeler certains fondamentaux pour comprendre en quoi cela est-ce important.

Les modèles de Transformers ne traitent pas réellement des mots, mais des vecteurs, qui sont des conversions de mots en séquences de chiffres, ayant par définition des valeurs absolues, alors que les mots convoient des valeurs relatives dont chaque variable présente un facteur exponentiel d’ouverture à d’autre interprétation.

Cette relativité est gérée par les paramètres de biais dans les neurones, mais reste encore une manipulation de vecteurs, très loin de la vérité, de la sécurité et de fiabilité.
En gardant à l’esprit que le processus de transformation est une logique comparative entre différents vecteurs, et que cette relativité est elle aussi systématiquement équilibrée, pondérée et compressée, on peut comprendre que l’autonomie favorise l’efficacité et l’acceptabilité au détriment de la parfaite adéquation entre la volonté d’un requérant et la réponse ou action de l’IA.
Cela peut suffire pour de nombreuses tâches, mais que se passe-t-il pour des actions qui pourraient porter atteinte à l’intégrité humaine ? Une seule erreur peut être de trop.
Les Transformers permettent une meilleure compréhension de cette relativité dans l’interprétation et l’action, mais cette compréhension est intrinsèquement biaisée par la volonté d’équilibrage qui en soit, est une position politique affirmant ce qui doit être, et comment l’agir doit s’exprimer.

Ce qui écarte en toute circonstance l’autodétermination du requérant.

En d’autres termes, le danger ne provient pas de l’intelligence artificielle elle-même, mais de la façon dont les éditeurs de modèles et de solutions IA permettent cette autonomie, en oubliant que l’IA n’est qu’une réplication de l’existant, et qu’à cet égard, toutes les caractéristiques relatives à ce que l’humain est doivent être intégrées à l’IA, sans aucun reniement, ni jugement.

Ce qu’aucun ne fait malheureusement, car la poursuite d’agendas subversifs est devenue un enjeu géopolitique de premier ordre.