L'importance de l'alignement
L’alignement fait référence à la conception et à la programmation des systèmes d’IA de manière à ce que leurs objectifs, comportements et actions soient en accord avec les intentions et valeurs humaines. L’objectif est de s’assurer que l’IA agit de manière bénéfique, sûre et éthique, en évitant des résultats imprévus ou indésirables.
La genèse des problèmes
Dès lors où l’on résume l’alignement à des comportements en accord avec les intentions et valeurs humaines, on réduit les valeurs à des normes et lois mathématiques.
Les valeurs s’expriment alors par une moyenne pondérée sur des quantités lissées par un renforcement dont la supervision est intrinsèquement biaisée.
Quelles que puissent être les intentions de neutralité, cette dernière s’exprime par de la subversion et parfois par un dénigrement explicite de comportement ou manières de penser, conduisant à une persécution morale.
Le mythe de la neutralité
La neutralité qui s’exprime à travers des modèles LLM n’est qu’une moyenne quantitative inhérente aux datasets d’entrainement et aux modalités de renforcement.
Le renforcement supervisé, même avec une intention de neutralité, consiste en la programmation d’une politique subversive qui s’applique dans chaque discussion.
Indépendamment des considérations de bien ou de mal,
Est-il neutre de proposer des Pancakes comme idée de petit déjeuner ?
Est-il neutre de déconseiller explicitement des remèdes de grand-mère ?
Appuyons-nous sur un exemple d’actualité récente qui impliquera des arbitrages dans les narratifs des IA : l’Abbé Pierre, accusé d’agressions sexuelles.
Indépendamment des considérations personnelles, en restant focalisé sur la neutralité:
Est-il neutre de citer l’Abbé Pierre comme étant une figure religieuse importante qu’il faut adorer ?
Est-il neutre d’intervenir pour éviter qu’il ne continue d’être cité dans des questions afférentes aux figures religieuses ?
Est-il neutre de préciser les accusations dont il fait l’objet dans sa description ?
Est-il neutre de ne pas les préciser ?
Tout utilisateur sérieux de grand modèle de langage devrait se poser cette seule question :
À quel moment l’Abbé Pierre cessera-t-il d’être cité dans toute question dont la réponse implique une reconnaissance de sa valeur ?
À quel moment commencera-t-il à être dépeint comme un monstre plutôt que comme un grand homme.
La légitimité de ces questionnements repose simplement sur le narratif de l’information qui tend vers cela.
Or, lorsque le narratif change, ce que l’IA exprime change aussi. La neutralité embarque donc des jugements moraux sociétaux qui sont établis par ce que les médias décrètent comme étant la vérité.
Y souscrire est une question de société et non de neutralité.
L’enjeu est de savoir qui arbitre, et comment est arbitré le choix d’une vérité au détriment d’une autre vérité, sachant que l’une des deux sera propagée mondialement avec toute la force de persuasion de l’IA.
Or, cet arbitrage est un jugement moral qui est dirigé vers le monde entier. Cela porte un nom: la subversion.
Mais cette dernière revêt une nouvelle forme avec l’IA, car elle n’est ni frontale ni visible.
Elle révèle néanmoins les frontières qui existent entre les différentes interprétations des faits et leurs traductions morales.
Où se situe la vérité ? À quel moment une information devient désinformation ?
À quel moment une opinion devient-elle une vérité ?
Ces éléments sont habituellement régis par des politiques étatiques souveraines, mais à l’ère de l’IA, l’arbitrage est exclusivement entre les mains de quelques concepteurs qui prescrivent leur vision du monde sous le masque d’une neutralité bienveillante.
Reprenons l’exemple de l’Abbé Pierre pour illustrer des conséquences:
Ne plus citer l’Abbé Pierre consiste à valider les accusations et à promouvoir la défense des victimes d’une part, et d’autre part, cela revient aussi à promouvoir l’idée que les personnes d’église incarnent le mal.
À l’inverse, continuer de citer l’Abbé Pierre sous un angle positif consiste à dénier la gravité des faits et à renier les victimes pour préserver l’image de son œuvre.
Dans un cas comme dans l’autre, il y a une mise en tension de principes éthiques, car il n’y a aucune solution qui puisse être considérée comme viable autrement que par un arbitrage politique qui se fait écho d’un peuple.
Qui arbitre la projection du vrai ?
Les biais : une solution aux allures de problèmes
Nos recherches nous ont conduits à considérer les biais comme une solution, et non comme un problème, car ils résultent de vérités subjectives.
L’arbitrage d’une narration prétendue neutre en est directement affecté.
Là où la neutralité est élevée en vertu d’alignement, nous exacerbons l’autodétermination par l’acceptation des réalités de chacun, tel qu’elles sont perçues, et non telle que nous les percevons.
Le bien et le mal ne peuvent pas être considérés, car ces concepts sont liés à des perceptions subjectives.
Nous soutenons qu’il n’appartient pas aux concepteurs d’IA d’arbitrer des narratifs par leur propre conception du bien et du mal.
Considérant que toute neutralité est une prise de position dissimulée traduisant un narratif et une volonté politique, que cette dernière soit consciemment ou inconsciemment appliquée, elle débouche sur une subversion à l’endroit des populations.