Réduire le risque, faute de le supprimer Expert

Hallucinations et garde-fous

Comprendre comment un produit sérieux réduit les hallucinations sans prétendre les éliminer.

🫏 Commence par la BD, c'est plus rigolo ! 🫏 Cette notion existe aussi en BD 🫏 Cette notion existe aussi en BD « IA raconte n'importe quoi » — lire l'histoire →

11 min hallucinationgarde-fousfiabilité

Je commence Je teste ma compréhension

Pas de jargon Compréhensible vite

On ancre la réponse sur des sources réelles (RAG).

On exige des citations et on autorise le « je ne sais pas ».

On valide les cas sensibles par un humain.

1. Je découvre une version simple et imagée

2. Je comprends le vrai mécanisme sans jargon inutile

3. Je m'entraîne avec un mini quiz immédiat

4. Je retiens les points clés à réexpliquer

Quand l'IA invente avec aplomb

Une « hallucination », c'est quand l'IA te sort une réponse qui a l'air super sûre… mais qui est fausse. Elle ne ment pas exprès : quand l'info lui manque, elle comble le trou avec ce qui « sonne juste ».
Le garde-fou n°1, c'est l'ancrage : on lui ouvre les vrais documents avant qu'elle réponde, pour qu'elle s'appuie dessus au lieu d'improviser.
On lui demande aussi de citer ses sources et de pouvoir dire « je ne sais pas » plutôt que d'inventer. Et sur les trucs sensibles, un humain repasse derrière.
Personne ne supprime ce risque à 100 %. Les apps sérieuses le mesurent dans le temps pour vérifier qu'il ne remonte pas.

Un exemple pour toi

Tu demandes à un chatbot l'année de sortie d'un jeu vidéo ou la bio d'un youtubeur : il peut te répondre une date hyper précise et fausse, inventer une citation, ou te donner une « source » qui n'existe pas. C'est joliment écrit, donc on a envie d'y croire.

Réflexe esprit critique : une réponse d'IA bien tournée n'est pas une preuve. Avant de recopier ça dans un devoir ou de le partager, vérifie au moins une source réelle (Wikipédia, site officiel, manuel). Méfie-toi surtout des citations, dates, chiffres et « références » qu'elle te donne : ce sont exactement les détails qu'elle invente le mieux.

Retiens l'image : un élève à qui on ouvre le bon livre et à qui on demande « d'où tu sors ça ? » se trompe beaucoup moins.

Le déclic en mouvement

Transforme une réponse inventée en réponse sourcée

Sans garde-fou, le modèle invente ; ancrage (RAG), citation, abstention et mesure fiabilisent la réponse. On réduit le risque, sans le supprimer.

Sans garde-fou, si l'info me manque, je peux inventer une réponse crédible.

« La clause 7 autorise un remboursement à 30 jours. »

❌ Inventé : aucune source vérifiée

Plausible, bien formulé… mais faux. C'est le risque à maîtriser.

Étape 1 / 4

Sous le capot

Pour les curieux : ce qui se passe à l'intérieur

Tape pour explorer Replier

Le bon livre

On lui ouvre la bonne page avant qu'elle réponde

Avant de poser ta question, on donne à l'IA le bon cahier ouvert à la bonne page. Comme ça, elle lit la vraie réponse au lieu de l'inventer dans sa tête. C'est comme un copain qui regarde le livre de classe avant de te répondre.

« Je sais pas »

Avoir le droit de dire « je ne sais pas »

On apprend à l'IA que c'est permis de dire « je ne sais pas » quand elle n'est pas sûre. C'est beaucoup mieux que d'inventer une réponse fausse en faisant semblant. Comme à l'école : mieux vaut lever le doigt et dire qu'on n'a pas trouvé que raconter n'importe quoi.

On revérifie

On regarde à deux fois pour repérer les bêtises

Pour attraper les erreurs, on compare plusieurs livres entre eux, ou on demande à une autre IA de relire la réponse, comme un copain qui corrige ta dictée. Aucune astuce ne marche à tous les coups, alors on les met toutes ensemble.

Un grand vérifie

Un adulte vérifie et on compte les erreurs

Pour les choses très importantes, c'est un humain qui regarde avant de dire oui, comme un maître qui valide ton travail. Et on compte combien de fois l'IA se trompe, pour voir si elle s'améliore ou si elle fait plus de bêtises qu'avant.

Grounding

Ancrer la réponse sur de vraies sources

Le RAG (recherche augmentée) va d'abord chercher les bons documents, puis les donne au modèle avant qu'il réponde. Résultat : l'IA s'appuie sur des textes réels au lieu de piocher uniquement dans sa mémoire, un peu comme citer ta source dans un exposé plutôt que d'écrire de tête. Ça réduit fortement les réponses inventées.

Abstention

Savoir dire « je ne sais pas »

L'abstention, c'est régler le modèle pour qu'il assume un « je ne sais pas » quand il n'a pas l'info, au lieu de balancer une réponse fausse avec assurance (comme un faux ami sur un QCM). Une absence de réponse vaut mieux qu'une erreur déguisée en certitude.

Détection

Recouper les sources et faire juger

On croise plusieurs sources, on vérifie automatiquement certains faits, ou on fait relire la réponse par un second modèle qui joue l'arbitre (un « modèle juge »). Pense au fact-checking d'une vidéo virale : aucune méthode n'est parfaite, donc on les combine.

Humain & mesure

Boucle humaine et évaluations

Sur les décisions critiques, un humain valide avant que ça parte (human-in-the-loop). Et on mesure le taux d'hallucination en continu avec des évaluations (des tests automatisés répétés), pour piloter le produit et repérer une « régression », c'est-à-dire quand ça se met soudain à empirer.

Grounding

Ancrer la réponse sur de vraies sources

Le RAG fournit au modèle les bons passages au bon moment. La réponse s'appuie sur des documents réels plutôt que sur sa seule mémoire, ce qui réduit l'invention.

Abstention

Savoir dire « je ne sais pas »

Un garde-fou clé : autoriser et calibrer le refus ou l'incertitude. Mieux vaut une absence de réponse qu'une fausse réponse présentée comme sûre.

Détection

Recouper et faire juger

On peut recouper plusieurs sources, vérifier automatiquement des faits, ou faire évaluer la réponse par un autre modèle. Aucune méthode n'est parfaite, on les combine.

Humain & mesure

Boucle humaine et évaluations

Sur les décisions critiques, un humain valide. Et on mesure en continu le taux d'hallucination avec des évaluations, pour piloter et détecter les régressions.

L'image mentale

L'analogie qui aide à retenir

C'est comme mettre plein de barrières autour d'un toboggan : on tombe moins, mais on fait quand même attention.

Réduire les hallucinations, c'est comme sécuriser une piste de skate : plusieurs barrières, pas une seule, et zéro risque n'existe jamais.

Réduire les hallucinations, c'est comme sécuriser une route : plusieurs garde-fous, pas un seul, et on ne supprime jamais tout risque.

À retenir

Le coeur de l'idée

Parfois la machine invente. Pour l'aider : on lui ouvre le bon livre, on demande d'où vient l'info, et un grand vérifie.

On ne supprime pas les hallucinations : on les réduit fort avec sources, citations, le droit de dire « je ne sais pas », un humain et une mesure régulière.

On ne supprime pas les hallucinations : on les réduit fortement avec ancrage, citations, abstention, validation humaine et mesure continue.

Comment ça marche

Le mécanisme, découpé étape par étape

Avant de répondre, on lui ouvre le bon livre, et elle regarde dedans.

On lui demande : « D'où vient ton info ? » pour qu'elle nous montre.

Quand c'est important, un grand vérifie avant.

Si elle ne sait pas, elle a le droit de dire « je ne sais pas ».

Avant de répondre, on lui donne les bons documents à lire (comme rouvrir ton cours avant un contrôle) : on appelle ça le RAG.

On lui demande de citer ses sources, et on l'autorise à répondre « je ne sais pas » au lieu d'inventer.

Pour les sujets sérieux, un humain vérifie la réponse avant qu'elle serve.

On mesure son taux d'erreur dans le temps pour voir si elle s'améliore ou si elle régresse.

On ancre la réponse sur des documents réels : le modèle s'appuie sur de vraies sources récupérées (RAG) plutôt que sur sa seule mémoire.

On exige des citations vérifiables et on calibre l'abstention : mieux vaut un « je ne sais pas » assumé qu'une fausse certitude.

Sur les décisions critiques, on garde un humain dans la boucle qui valide avant action.

On mesure le taux d'erreur en continu avec des évaluations, pour piloter et détecter les régressions.

Exemples très concrets

Où tu retrouves ça dans le monde réel

Tape pour explorer Replier

Tu demandes le nom d'un dessin animé : elle regarde la bonne image avant de répondre.

Tu demandes combien tu as de billes : elle dit « je ne sais pas, compte-les avec moi ».

La maîtresse relit la réponse avant de la coller dans ton cahier.

Un assistant de devoirs qui te donne la page exacte du manuel d'où vient sa réponse.

Une IA qui répond « je ne sais pas » plutôt que d'inventer la date de sortie d'un jeu.

Un correcteur qui demande à un prof de valider avant de mettre une note officielle.

Un assistant juridique qui cite l'article exact du règlement à l'appui de sa réponse.

Un chatbot support qui refuse de répondre faute de source fiable plutôt que d'inventer une procédure.

Une validation humaine obligatoire avant un virement ou l'envoi d'un e-mail client.

Points de vigilance

Ce qu'il ne faut pas confondre

Tape pour explorer Replier

Elle peut encore inventer, même avec les astuces.

Trop de règles, et elle répond tout doucement ou dit non tout le temps.

Si on lui donne un mauvais livre, elle redit une bêtise.

Aucune méthode ne garantit zéro invention.

Trop de garde-fous rendent l'IA lente ou la font refuser trop souvent.

Une mauvaise source donne une mauvaise réponse : la qualité des documents compte.

Aucune méthode ne garantit zéro hallucination.

Trop de garde-fous peuvent rendre le système rigide ou lent.

Une mauvaise source ancre une mauvaise réponse : la qualité documentaire compte.

Mythes vs réalité

Remplace les fausses idées par les bonnes

On corrige les réflexes faux que beaucoup gardent, pour ancrer une image mentale juste et solide.

Ce qu'on imagine

On croit qu'une machine très forte ne se trompe jamais.

Ce qu'il faut garder

En vrai, même la plus forte invente parfois. On fait moins d'erreurs, mais pas zéro.

Ce qu'on imagine

On croit qu'avec le bon livre, elle ne se trompe plus du tout.

Ce qu'il faut garder

En vrai, si le livre dit une bêtise, elle redit la bêtise.

Ce qu'on imagine

On croit que plus on met de barrières, mieux c'est.

Ce qu'il faut garder

En vrai, trop de barrières et elle devient toute lente et dit non à tout.

Ce qu'on imagine

« Une IA puissante ne se trompe jamais. »

Ce qu'il faut garder

Faux. Même les meilleures inventent parfois. On réduit le risque, on ne l'efface pas.

Ce qu'on imagine

« Lui donner les bons documents (RAG) supprime toutes les erreurs. »

Ce qu'il faut garder

Non. Si elle pioche dans une mauvaise source, sa réponse peut rester fausse.

Ce qu'on imagine

« Plus on met de garde-fous, mieux c'est, toujours. »

Ce qu'il faut garder

Pas vraiment. Trop de barrières la rendent lente, rigide et elle finit par refuser des trucs normaux.

Ce qu'on imagine

« Un bon modèle n'hallucine jamais. »

Ce qu'il faut garder

Faux. Même les meilleurs hallucinent parfois. On réduit le risque, on ne le supprime pas.

Ce qu'on imagine

« Le RAG élimine les hallucinations. »

Ce qu'il faut garder

Non. Il les réduit, mais une mauvaise récupération ou de mauvaises sources peuvent encore tromper le modèle.

Ce qu'on imagine

« Plus de garde-fous, toujours mieux. »

Ce qu'il faut garder

Pas forcément. Trop de contraintes rendent le système rigide, lent ou inutilement fermé.

Mémo final

À la fin, ce sont ces idées qui doivent rester

Si tu peux les redire sans relire la fiche, l'essentiel est acquis.

Le bon livre

On lui ouvre la bonne page avant qu'elle réponde.

D'où ça vient ?

Elle nous montre où elle a trouvé.

Un grand vérifie

Pour les choses importantes, on relit.

« Je ne sais pas »

Elle a le droit de le dire au lieu d'inventer.

Mémo final

À la fin, ce sont ces idées qui doivent rester

Si tu peux les redire sans relire la fiche, l'essentiel est acquis.

Ancrer (RAG)

Lui donner les vrais documents avant de répondre.

Citer + s'abstenir

Montrer ses sources et oser le « je ne sais pas ».

Humain sur le sérieux

Faire vérifier les réponses qui comptent vraiment.

Mesurer

Suivre le taux d'erreur dans le temps.

Mémo final

À la fin, ce sont ces idées qui doivent rester

Si tu peux les redire sans relire la fiche, l'essentiel est acquis.

Ancrer

RAG : appuyer la réponse sur de vraies sources.

Abstention

Autoriser et calibrer le « je ne sais pas ».

Humain sur le critique

Valider les décisions sensibles ou irréversibles.

Mesurer

Suivre le taux d'erreur en continu via des évaluations.

🫏 L'IA du Zéro🧑 Ado

Ma carte mémo

Hallucinations et garde-fous

À la fin, ce sont ces idées qui doivent rester

Ancrer (RAG)Lui donner les vrais documents avant de répondre.
Citer + s'abstenirMontrer ses sources et oser le « je ne sais pas ».
Humain sur le sérieuxFaire vérifier les réponses qui comptent vraiment.
MesurerSuivre le taux d'erreur dans le temps.

iaduzero.fr — Comprendre l'IA, de zéro à expert 🇫🇷

Questions fréquentes

Les questions qu'on se pose souvent

Des réponses courtes et claires, sans jargon, pour lever les doutes.

Peut-on supprimer les hallucinations ?

Non. On peut fortement les réduire (ancrage, citations, abstention, validation, mesure), mais pas les éliminer totalement.

Le RAG suffit-il ?

Il aide beaucoup, mais ne suffit pas seul : si la recherche ramène de mauvaises sources, la réponse peut rester fausse.

C'est quoi l'« abstention » ?

La capacité du système à dire « je ne sais pas » plutôt que d'inventer. Bien calibrée, c'est un garde-fou puissant.

Comment savoir si ça marche ?

En mesurant : des évaluations suivent le taux d'hallucination dans le temps et détectent les régressions.

Continuer le parcours

La suite, pensée comme une montée en compréhension

On monte d'un cran à chaque étape, toujours avec la même promesse de clarté.

Voir la fiche

Évaluations et fiabilité

Pour mesurer le taux d'erreur et piloter les garde-fous.

Suite 1

Voir la fiche

RAG expliqué simplement

Le garde-fou n°1 : ancrer la réponse sur de vraies sources (Niveau 2).

Suite 2

Voir la fiche

Pourquoi l'IA se trompe

Pour revoir, simplement, d'où viennent les erreurs (Niveau 1).

Suite 3