On ancre la réponse sur des sources réelles (RAG).
Hallucinations et garde-fous
Comprendre comment un produit sérieux réduit les hallucinations sans prétendre les éliminer.
🫏 Commence par la BD, c'est plus rigolo ! 🫏 Cette notion existe aussi en BD 🫏 Cette notion existe aussi en BD « IA raconte n'importe quoi » — lire l'histoire →
On exige des citations et on autorise le « je ne sais pas ».
On valide les cas sensibles par un humain.
Quand l'IA invente avec aplomb
- Une « hallucination », c'est quand l'IA te sort une réponse qui a l'air super sûre… mais qui est fausse. Elle ne ment pas exprès : quand l'info lui manque, elle comble le trou avec ce qui « sonne juste ».
- Le garde-fou n°1, c'est l'ancrage : on lui ouvre les vrais documents avant qu'elle réponde, pour qu'elle s'appuie dessus au lieu d'improviser.
- On lui demande aussi de citer ses sources et de pouvoir dire « je ne sais pas » plutôt que d'inventer. Et sur les trucs sensibles, un humain repasse derrière.
- Personne ne supprime ce risque à 100 %. Les apps sérieuses le mesurent dans le temps pour vérifier qu'il ne remonte pas.
Tu demandes à un chatbot l'année de sortie d'un jeu vidéo ou la bio d'un youtubeur : il peut te répondre une date hyper précise et fausse, inventer une citation, ou te donner une « source » qui n'existe pas. C'est joliment écrit, donc on a envie d'y croire.
Réflexe esprit critique : une réponse d'IA bien tournée n'est pas une preuve. Avant de recopier ça dans un devoir ou de le partager, vérifie au moins une source réelle (Wikipédia, site officiel, manuel). Méfie-toi surtout des citations, dates, chiffres et « références » qu'elle te donne : ce sont exactement les détails qu'elle invente le mieux.
Retiens l'image : un élève à qui on ouvre le bon livre et à qui on demande « d'où tu sors ça ? » se trompe beaucoup moins.
Transforme une réponse inventée en réponse sourcée
Sans garde-fou, le modèle invente ; ancrage (RAG), citation, abstention et mesure fiabilisent la réponse. On réduit le risque, sans le supprimer.
« La clause 7 autorise un remboursement à 30 jours. »
Plausible, bien formulé… mais faux. C'est le risque à maîtriser.
Sous le capot Pour les curieux : ce qui se passe à l'intérieur
Tape pour explorer Replier
On lui ouvre la bonne page avant qu'elle réponde
Avant de poser ta question, on donne à l'IA le bon cahier ouvert à la bonne page. Comme ça, elle lit la vraie réponse au lieu de l'inventer dans sa tête. C'est comme un copain qui regarde le livre de classe avant de te répondre.
Avoir le droit de dire « je ne sais pas »
On apprend à l'IA que c'est permis de dire « je ne sais pas » quand elle n'est pas sûre. C'est beaucoup mieux que d'inventer une réponse fausse en faisant semblant. Comme à l'école : mieux vaut lever le doigt et dire qu'on n'a pas trouvé que raconter n'importe quoi.
On regarde à deux fois pour repérer les bêtises
Pour attraper les erreurs, on compare plusieurs livres entre eux, ou on demande à une autre IA de relire la réponse, comme un copain qui corrige ta dictée. Aucune astuce ne marche à tous les coups, alors on les met toutes ensemble.
Un adulte vérifie et on compte les erreurs
Pour les choses très importantes, c'est un humain qui regarde avant de dire oui, comme un maître qui valide ton travail. Et on compte combien de fois l'IA se trompe, pour voir si elle s'améliore ou si elle fait plus de bêtises qu'avant.
Ancrer la réponse sur de vraies sources
Le RAG (recherche augmentée) va d'abord chercher les bons documents, puis les donne au modèle avant qu'il réponde. Résultat : l'IA s'appuie sur des textes réels au lieu de piocher uniquement dans sa mémoire, un peu comme citer ta source dans un exposé plutôt que d'écrire de tête. Ça réduit fortement les réponses inventées.
Savoir dire « je ne sais pas »
L'abstention, c'est régler le modèle pour qu'il assume un « je ne sais pas » quand il n'a pas l'info, au lieu de balancer une réponse fausse avec assurance (comme un faux ami sur un QCM). Une absence de réponse vaut mieux qu'une erreur déguisée en certitude.
Recouper les sources et faire juger
On croise plusieurs sources, on vérifie automatiquement certains faits, ou on fait relire la réponse par un second modèle qui joue l'arbitre (un « modèle juge »). Pense au fact-checking d'une vidéo virale : aucune méthode n'est parfaite, donc on les combine.
Boucle humaine et évaluations
Sur les décisions critiques, un humain valide avant que ça parte (human-in-the-loop). Et on mesure le taux d'hallucination en continu avec des évaluations (des tests automatisés répétés), pour piloter le produit et repérer une « régression », c'est-à-dire quand ça se met soudain à empirer.
Ancrer la réponse sur de vraies sources
Le RAG fournit au modèle les bons passages au bon moment. La réponse s'appuie sur des documents réels plutôt que sur sa seule mémoire, ce qui réduit l'invention.
Savoir dire « je ne sais pas »
Un garde-fou clé : autoriser et calibrer le refus ou l'incertitude. Mieux vaut une absence de réponse qu'une fausse réponse présentée comme sûre.
Recouper et faire juger
On peut recouper plusieurs sources, vérifier automatiquement des faits, ou faire évaluer la réponse par un autre modèle. Aucune méthode n'est parfaite, on les combine.
Boucle humaine et évaluations
Sur les décisions critiques, un humain valide. Et on mesure en continu le taux d'hallucination avec des évaluations, pour piloter et détecter les régressions.
L'analogie qui aide à retenir
C'est comme mettre plein de barrières autour d'un toboggan : on tombe moins, mais on fait quand même attention.
Réduire les hallucinations, c'est comme sécuriser une piste de skate : plusieurs barrières, pas une seule, et zéro risque n'existe jamais.
Réduire les hallucinations, c'est comme sécuriser une route : plusieurs garde-fous, pas un seul, et on ne supprime jamais tout risque.
Le coeur de l'idée
Parfois la machine invente. Pour l'aider : on lui ouvre le bon livre, on demande d'où vient l'info, et un grand vérifie.
On ne supprime pas les hallucinations : on les réduit fort avec sources, citations, le droit de dire « je ne sais pas », un humain et une mesure régulière.
On ne supprime pas les hallucinations : on les réduit fortement avec ancrage, citations, abstention, validation humaine et mesure continue.
Le mécanisme, découpé étape par étape
Avant de répondre, on lui ouvre le bon livre, et elle regarde dedans.
On lui demande : « D'où vient ton info ? » pour qu'elle nous montre.
Quand c'est important, un grand vérifie avant.
Si elle ne sait pas, elle a le droit de dire « je ne sais pas ».
Avant de répondre, on lui donne les bons documents à lire (comme rouvrir ton cours avant un contrôle) : on appelle ça le RAG.
On lui demande de citer ses sources, et on l'autorise à répondre « je ne sais pas » au lieu d'inventer.
Pour les sujets sérieux, un humain vérifie la réponse avant qu'elle serve.
On mesure son taux d'erreur dans le temps pour voir si elle s'améliore ou si elle régresse.
On ancre la réponse sur des documents réels : le modèle s'appuie sur de vraies sources récupérées (RAG) plutôt que sur sa seule mémoire.
On exige des citations vérifiables et on calibre l'abstention : mieux vaut un « je ne sais pas » assumé qu'une fausse certitude.
Sur les décisions critiques, on garde un humain dans la boucle qui valide avant action.
On mesure le taux d'erreur en continu avec des évaluations, pour piloter et détecter les régressions.
Exemples très concrets Où tu retrouves ça dans le monde réel
Tape pour explorer Replier
Tu demandes le nom d'un dessin animé : elle regarde la bonne image avant de répondre.
Tu demandes combien tu as de billes : elle dit « je ne sais pas, compte-les avec moi ».
La maîtresse relit la réponse avant de la coller dans ton cahier.
Un assistant de devoirs qui te donne la page exacte du manuel d'où vient sa réponse.
Une IA qui répond « je ne sais pas » plutôt que d'inventer la date de sortie d'un jeu.
Un correcteur qui demande à un prof de valider avant de mettre une note officielle.
Un assistant juridique qui cite l'article exact du règlement à l'appui de sa réponse.
Un chatbot support qui refuse de répondre faute de source fiable plutôt que d'inventer une procédure.
Une validation humaine obligatoire avant un virement ou l'envoi d'un e-mail client.
Points de vigilance Ce qu'il ne faut pas confondre
Tape pour explorer Replier
Elle peut encore inventer, même avec les astuces.
Trop de règles, et elle répond tout doucement ou dit non tout le temps.
Si on lui donne un mauvais livre, elle redit une bêtise.
Aucune méthode ne garantit zéro invention.
Trop de garde-fous rendent l'IA lente ou la font refuser trop souvent.
Une mauvaise source donne une mauvaise réponse : la qualité des documents compte.
Aucune méthode ne garantit zéro hallucination.
Trop de garde-fous peuvent rendre le système rigide ou lent.
Une mauvaise source ancre une mauvaise réponse : la qualité documentaire compte.
Remplace les fausses idées par les bonnes
On corrige les réflexes faux que beaucoup gardent, pour ancrer une image mentale juste et solide.
On croit qu'une machine très forte ne se trompe jamais.
En vrai, même la plus forte invente parfois. On fait moins d'erreurs, mais pas zéro.
On croit qu'avec le bon livre, elle ne se trompe plus du tout.
En vrai, si le livre dit une bêtise, elle redit la bêtise.
On croit que plus on met de barrières, mieux c'est.
En vrai, trop de barrières et elle devient toute lente et dit non à tout.
« Une IA puissante ne se trompe jamais. »
Faux. Même les meilleures inventent parfois. On réduit le risque, on ne l'efface pas.
« Lui donner les bons documents (RAG) supprime toutes les erreurs. »
Non. Si elle pioche dans une mauvaise source, sa réponse peut rester fausse.
« Plus on met de garde-fous, mieux c'est, toujours. »
Pas vraiment. Trop de barrières la rendent lente, rigide et elle finit par refuser des trucs normaux.
« Un bon modèle n'hallucine jamais. »
Faux. Même les meilleurs hallucinent parfois. On réduit le risque, on ne le supprime pas.
« Le RAG élimine les hallucinations. »
Non. Il les réduit, mais une mauvaise récupération ou de mauvaises sources peuvent encore tromper le modèle.
« Plus de garde-fous, toujours mieux. »
Pas forcément. Trop de contraintes rendent le système rigide, lent ou inutilement fermé.
À la fin, ce sont ces idées qui doivent rester
Si tu peux les redire sans relire la fiche, l'essentiel est acquis.
On lui ouvre la bonne page avant qu'elle réponde.
Elle nous montre où elle a trouvé.
Pour les choses importantes, on relit.
Elle a le droit de le dire au lieu d'inventer.
À la fin, ce sont ces idées qui doivent rester
Si tu peux les redire sans relire la fiche, l'essentiel est acquis.
Lui donner les vrais documents avant de répondre.
Montrer ses sources et oser le « je ne sais pas ».
Faire vérifier les réponses qui comptent vraiment.
Suivre le taux d'erreur dans le temps.
À la fin, ce sont ces idées qui doivent rester
Si tu peux les redire sans relire la fiche, l'essentiel est acquis.
RAG : appuyer la réponse sur de vraies sources.
Autoriser et calibrer le « je ne sais pas ».
Valider les décisions sensibles ou irréversibles.
Suivre le taux d'erreur en continu via des évaluations.
Les questions qu'on se pose souvent
Des réponses courtes et claires, sans jargon, pour lever les doutes.
Peut-on supprimer les hallucinations ?
Non. On peut fortement les réduire (ancrage, citations, abstention, validation, mesure), mais pas les éliminer totalement.
Le RAG suffit-il ?
Il aide beaucoup, mais ne suffit pas seul : si la recherche ramène de mauvaises sources, la réponse peut rester fausse.
C'est quoi l'« abstention » ?
La capacité du système à dire « je ne sais pas » plutôt que d'inventer. Bien calibrée, c'est un garde-fou puissant.
Comment savoir si ça marche ?
En mesurant : des évaluations suivent le taux d'hallucination dans le temps et détectent les régressions.
La suite, pensée comme une montée en compréhension
On monte d'un cran à chaque étape, toujours avec la même promesse de clarté.