LLM : ce que c’est vraiment, et pourquoi ça change tout

Quand un dirigeant me demande « comment ça marche, l’IA ? », il s’attend parfois à une réponse mystérieuse. Ce qu’il obtient, c’est une réponse à la fois plus simple et plus déstabilisante que ce qu’il imaginait.

Un LLM — Large Language Model, modèle de langage de grande taille — prédit le mot suivant. C’est le cœur du mécanisme. Pas une intelligence qui réfléchit, pas une conscience qui comprend. Un système statistique extraordinairement sophistiqué qui, à partir de ce qui précède dans un texte, calcule ce qui doit suivre.

Et pourtant, ce système produit des résultats qui, dans un nombre croissant de situations, dépassent ce que des experts humains produisent en beaucoup plus de temps.

Comment ça a été construit

Les modèles que nous utilisons aujourd’hui — GPT-4o, Claude Sonnet, Gemini — ont été entraînés sur des volumes de texte qu’il est difficile de concevoir concrètement. Des centaines de milliards de mots issus du web, de livres, d’articles scientifiques, de code, de discussions. Pendant l’entraînement, le modèle a appris à prédire le mot suivant dans des contextes de plus en plus variés. C’est tout. Mais « c’est tout » représente des mois de calcul sur des milliers de processeurs spécialisés, pour un coût qui se chiffre en dizaines, parfois en centaines de millions de dollars.

Ce qui sort de cet entraînement, c’est un objet mathématique — un réseau de neurones artificiels avec des milliards de paramètres — qui a intériorisé des structures, des logiques, des associations présentes dans l’ensemble du corpus. Il n’a pas « mémorisé » les textes. Il en a extrait les patterns.

Ce que ça signifie en pratique

La conséquence directe de ce mécanisme, c’est que le LLM est très fort pour tout ce qui ressemble à ce qu’il a vu. Il synthétise bien, il reformule bien, il structure bien, il traduit bien, il génère du code, il rédige des emails, il résume des documents. Il est moins fiable sur tout ce qui nécessite un ancrage dans le réel actuel — il peut « halluciner », c’est-à-dire produire des informations fausses avec la même assurance que des informations vraies, parce qu’il n’a pas accès à la réalité, seulement à des représentations linguistiques de la réalité.

C’est pour ça que je dis à mes clients : utilisez-le comme un collaborateur très compétent qui n’a jamais quitté son bureau, qui lit tout mais ne vérifie rien. Son travail doit être relu, contextualisé, ancré dans votre connaissance du terrain.

Ce que ça ne dit pas

Le mécanisme n’explique pas tout. Le fait qu’un LLM soit « seulement » un prédicteur statistique ne dit rien, à ce stade, sur ce qu’il se passe à l’intérieur — si tant est que ce mot ait un sens. Plusieurs philosophes et chercheurs en sciences cognitives, dont David Chalmers, ont posé publiquement la question de savoir si des systèmes comme GPT-4 pourraient avoir une forme d’expérience. La réponse honnête est : nous ne savons pas. Ce que nous savons, c’est que le mécanisme de surface — prédire le mot suivant — n’exclut pas que quelque chose de plus se passe en dessous.

Ce n’est pas une raison de prêter à l’IA des intentions ou des émotions qu’elle n’a vraisemblablement pas. Mais c’est une raison de rester humble face à une technologie que nous commençons tout juste à comprendre.

Cécile Azard

83 % des jeunes amoureux de l’IA : narcissisme ou solitude ?

Articles recommandés

L’IA et le monde du travail : ce qui se passe vraiment, et ce qui vient

83 % des jeunes amoureux de l’IA : narcissisme ou solitude ?

Robotomorphisme : quand on attend de l’humain qu’il se comporte comme une IA

Humanisme et transhumanisme : ce que l’IA nous oblige à décider

Laisser un commentaire Annuler la réponse