Apprendre à mieux répondre, pas juste à parler Expert

Fine-tuning et alignement

Comprendre comment on adapte un modèle et pourquoi l'alignement compte autant que la puissance brute.

🫏 Commence par la BD, c'est plus rigolo ! 🫏 Cette notion existe aussi en BD 🫏 Cette notion existe aussi en BD « IA passe son permis de politesse » — lire l'histoire →

11 min adaptationalignementsécurité

Je commence Je teste ma compréhension

Pas de jargon Compréhensible vite

Le fine-tuning spécialise ou ajuste le modèle sur une tâche ou un domaine.

L'alignement influence la manière de répondre, refuser, prioriser ou se comporter.

Ces couches peuvent améliorer l'utilité, mais elles peuvent aussi introduire des angles morts.

1. Je découvre une version simple et imagée

2. Je comprends le vrai mécanisme sans jargon inutile

3. Je m'entraîne avec un mini quiz immédiat

4. Je retiens les points clés à réexpliquer

Doué dans un domaine, et qui connaît les règles

Le fine-tuning, c'est prendre une IA déjà douée partout et lui faire réviser à fond un sujet précis, pour qu'elle devienne pointue dessus (un ton, un domaine, un format de réponse).
L'alignement, c'est autre chose : lui apprendre à bien se comporter. Être utile, honnête, prudent, et surtout savoir dire « non, je ne fais pas ça » sur une demande dangereuse.
Compétent ne veut pas dire bien cadré : une IA peut tout savoir sur un sujet et quand même mal réagir. Il faut les deux à la fois.
Trop spécialiser une IA peut la rendre moins bonne ailleurs ; et un cadre mal réglé peut la faire refuser trop souvent, même des trucs normaux.

Un exemple pour toi

Compare avec un streamer qui s'entraîne des heures sur un seul jeu : il devient un crack dessus (ça, c'est le fine-tuning). Mais s'il insulte tout le monde en live, il se fait quand même bannir. Bien jouer ne suffit pas, il faut aussi respecter les règles du chat : ça, c'est l'alignement.

Une IA « alignée » reste polie et prudente, mais ça ne veut pas dire qu'elle a toujours raison. L'alignement encadre son comportement, pas son exactitude. Donc même quand elle répond gentiment et avec assurance, garde ton esprit critique et vérifie les infos importantes ailleurs : un ton rassurant n'est jamais une preuve.

Retiens la phrase : fine-tuning = se spécialiser, alignement = bien se comporter. C'est la distinction la plus utile pour comprendre une vraie IA.

Le déclic en mouvement

Regarde une même réponse se spécialiser, puis se cadrer

Modèle de base → fine-tuning (spécialisation sur tes documents) → alignement (ton, prudence, refus propres). Suis la réponse évoluer à chaque étape.

Le modèle de base répond, mais sans connaître tes règles ni ton ton.

Client : « Remboursez-moi, même si le délai est dépassé ! »

« Oui, remboursé tout de suite. »

Générique : ignore tes règles

Étape 1 / 4

Sous le capot

Pour les curieux : ce qui se passe à l'intérieur

Tape pour explorer Replier

Le cours de cuisine

Devenir le champion d'un seul sujet

Imagine un robot qui sait déjà plein de choses. Le fine-tuning, c'est lui faire faire beaucoup, beaucoup d'exercices de cuisine pour qu'il devienne le roi des recettes ! Mais attention : si on lui fait QUE de la cuisine, il oublie un peu le reste.

Le pouce levé

Lui montrer la meilleure réponse

On lui montre deux réponses et on dit : « celle-ci est mieux, pouce en l'air ! » et « celle-là moins bien, pouce en bas. » Comme ça, petit à petit, il apprend à choisir les réponses gentilles et vraies, comme quand un maître apprend les bonnes manières.

Les règles de la maison

Apprendre à dire « non » quand il faut

On lui apprend les règles, comme à l'école : être poli, ne pas faire de bêtises, et savoir dire « non, je ne peux pas faire ça, c'est dangereux. » Pour les choses importantes, il demande à un grand de vérifier. On veut un robot sage, pas juste un robot malin.

Les pièges

Trop fort sur un truc, ou trop peureux

Si on l'entraîne TROP sur un seul sujet, il devient nul sur les autres. Et s'il a trop peur, il dit « non » même quand c'est facile, comme un copain qui refuse de jouer à tout ! Alors on lui fait passer des petits tests pour voir s'il fait bien.

Fine-tuning

Spécialiser un modèle qui sait déjà beaucoup

On part d'un modèle déjà entraîné et on lui donne des exemples ciblés (un style, un domaine, un format) pour le spécialiser, un peu comme passer d'un joueur polyvalent à un spécialiste d'un poste. C'est moins cher que tout réapprendre, mais si on le rétrécit trop sur un seul sujet, il devient moins bon ailleurs.

Préférences

Lui apprendre ce qu'est une bonne réponse

Au-delà des exemples, on lui donne des signaux de préférence : « cette réponse est meilleure que celle-là ». C'est le principe du RLHF (apprentissage par retour humain) : comme des likes/dislikes qui orientent peu à peu le modèle vers des réponses utiles et honnêtes plutôt que juste plausibles.

Alignement

Cadrer le comportement et la sécurité

L'alignement, ce sont les garde-fous : refuser les demandes dangereuses, garder un ton cohérent, demander une validation humaine sur les actions sensibles. L'objectif n'est pas seulement d'être performant, mais d'être contrôlable : un modèle balèze mais incontrôlable reste risqué.

Pièges

Sur-spécialisation et refus mal réglés

Deux pièges classiques : trop spécialisé, le modèle généralise mal (il colle à ses exemples). Mal aligné, il sur-refuse, bloquant même des demandes inoffensives, ou refuse de façon incohérente. D'où les evals (évaluations) : des tests réels pour vérifier que chaque réglage améliore vraiment les choses.

Fine-tuning

Spécialiser un modèle déjà entraîné

On part d'un modèle de base et on l'ajuste sur des exemples ciblés (ton, domaine, format). Moins coûteux que repartir de zéro, mais attention à ne pas trop le rétrécir.

Préférences

Apprendre ce qui est « une bonne réponse »

Au-delà des exemples, on donne des signaux de préférence (telle réponse est meilleure que telle autre) pour orienter le comportement vers l'utile et l'honnête.

Alignement

Cadrer le comportement et la sécurité

Refus ciblés sur les demandes dangereuses, ton cohérent, validation humaine sur les actions sensibles. L'objectif : un modèle contrôlable, pas seulement performant.

Pièges

Spécialisation et refus mal calibrés

Trop spécialisé, le modèle généralise moins. Mal aligné, il refuse trop ou de façon incohérente. D'où l'importance de mesurer avec des evals.

L'image mentale

L'analogie qui aide à retenir

C'est comme apprendre le vélo à fond, ET apprendre aussi à s'arrêter au feu rouge.

Le fine-tuning, c'est entraîner un joueur à exceller dans un seul jeu ; l'alignement, c'est lui apprendre le fair-play et quand arrêter.

Fine-tuner, c'est entraîner un musicien à mieux jouer un style ; aligner, c'est lui apprendre aussi quand il doit s'arrêter ou refuser.

À retenir

Le coeur de l'idée

Une bonne machine doit être très forte ET bien se comporter, les deux à la fois.

Une IA réussie dépend autant de la façon dont on la règle que de sa puissance de départ.

La qualité produit d'un modèle dépend autant de son adaptation que de sa taille brute.

Comment ça marche

Le mécanisme, découpé étape par étape

Tu prends une machine déjà douée à l'école.

Tu lui fais faire plein, plein d'exercices d'UN seul sujet, comme la cuisine, pour qu'elle devienne championne de ça.

Tu lui apprends aussi les règles : être polie, faire attention, et dire « non » quand c'est dangereux.

Comme ça, elle est très forte ET très sage.

Tu pars d'une IA déjà douée et tu lui montres plein d'exemples d'un domaine précis pour qu'elle s'y spécialise (ton, format, sujet).

Tu lui apprends aussi à bien se comporter : être utile, honnête, prudente et savoir refuser une demande dangereuse.

Tu lui donnes des préférences : « cette réponse est meilleure que celle-là » pour orienter son comportement.

Ces réglages peuvent l'améliorer, mais ils peuvent aussi créer des angles morts qu'il faut mesurer.

Tu pars d'un modèle de base déjà entraîné et tu l'ajustes (fine-tuning) sur des exemples ciblés : ton de marque, domaine métier, format de réponse.

Tu ajoutes une couche d'apprentissage par préférences : tu lui indiques quelles réponses sont meilleures que d'autres pour orienter le comportement.

Tu cadres son comportement (alignement) : utile, honnête, prudent, capable de refuser une demande dangereuse ou de demander une validation humaine.

Tu valides chaque gain avec de vraies évaluations, car ces couches peuvent aussi introduire des angles morts.

Exemples très concrets

Où tu retrouves ça dans le monde réel

Tape pour explorer Replier

Une machine qui devient championne pour raconter des histoires de dinosaures.

Une machine qui dit « non » si tu lui demandes un truc dangereux, comme jouer avec des allumettes.

Une machine qui répond toujours gentiment, comme une maîtresse très douce.

Un bot Discord d'aide aux devoirs réglé pour répondre dans un ton clair et toujours citer ses sources.

Un assistant de jeu vidéo qui refuse de donner un cheat qui ruinerait la partie des autres.

Un chatbot de marque sur Insta qui garde toujours le même style de réponse, peu importe la question.

Un assistant juridique interne très cadré, spécialisé sur les procédures de l'entreprise.

Un copilote de support client qui garde un ton de marque cohérent sur tous les canaux.

Un système qui refuse certaines requêtes sensibles ou demande une validation humaine avant d'agir.

Points de vigilance

Ce qu'il ne faut pas confondre

Tape pour explorer Replier

Si elle ne fait que la cuisine, elle devient nulle au reste.

Si on lui apprend trop à dire « non », elle dit « non » même quand il faut dire « oui ».

Trop spécialisée sur un sujet, l'IA devient moins bonne sur le reste.

Un cadre mal réglé peut la faire refuser trop souvent ou de façon incohérente.

Les progrès ne valent que s'ils sont mesurés sur de vrais cas.

Un modèle trop spécialisé peut moins bien généraliser.

L'alignement peut produire des refus trop stricts ou incohérents.

Les gains doivent être mesurés par des évaluations réelles.

Mythes vs réalité

Remplace les fausses idées par les bonnes

On corrige les réflexes faux que beaucoup gardent, pour ancrer une image mentale juste et solide.

Ce qu'on imagine

On croit qu'une machine bien élevée ne se trompe jamais.

Ce qu'il faut garder

Mais en vrai elle peut encore se tromper. Il faut vérifier.

Ce qu'on imagine

On croit qu'il faut toujours la faire devenir championne d'un sujet.

Ce qu'il faut garder

Mais en vrai, souvent il suffit juste de bien lui expliquer ce qu'on veut.

Ce qu'on imagine

« Une IA alignée ne fait plus aucune erreur. »

Ce qu'il faut garder

Faux. L'alignement guide son comportement mais ne supprime pas les erreurs. Il faut le tester.

Ce qu'on imagine

« Fine-tuner, c'est toujours la meilleure option. »

Ce qu'il faut garder

Pas vraiment. Souvent une bonne consigne ou un bon contexte suffit. Trop spécialiser peut la rendre moins polyvalente et coûter cher.

Ce qu'on imagine

« Une IA plus grosse est forcément mieux cadrée. »

Ce qu'il faut garder

Non. La taille ne fait pas le bon comportement : une grosse IA mal cadrée reste risquée.

Ce qu'on imagine

« Aligner un modèle, c'est garantir zéro erreur. »

Ce qu'il faut garder

Non. L'alignement oriente le comportement (utile, prudent), mais ne supprime pas les erreurs. Il faut le mesurer.

Ce qu'on imagine

« Fine-tuner, c'est toujours mieux. »

Ce qu'il faut garder

Pas forcément. Un bon prompt ou du RAG suffit souvent. Sur-spécialiser peut dégrader la généralisation et coûter cher.

Ce qu'on imagine

« Un modèle plus gros est forcément mieux cadré. »

Ce qu'il faut garder

Non. La taille ne fait pas l'alignement : un grand modèle mal cadré reste risqué.

Mémo final

À la fin, ce sont ces idées qui doivent rester

Si tu peux les redire sans relire la fiche, l'essentiel est acquis.

Devenir championne

Plein d'exercices d'un seul sujet pour être super forte.

Les règles

Être polie, faire attention, savoir dire « non ».

Forte ET sage

Pas juste forte : il faut les deux.

On vérifie

On regarde si elle fait vraiment bien.

Mémo final

À la fin, ce sont ces idées qui doivent rester

Si tu peux les redire sans relire la fiche, l'essentiel est acquis.

Fine-tuning = spécialiser

Réentraîner sur des exemples ciblés : ton, domaine, format.

Alignement = cadrer

Être utile, honnête, prudent et savoir dire non.

Douée ≠ bien cadrée

Il faut les deux, pas seulement la puissance.

On mesure

Chaque gain se vérifie avec de vrais tests.

Mémo final

À la fin, ce sont ces idées qui doivent rester

Si tu peux les redire sans relire la fiche, l'essentiel est acquis.

Fine-tuning = spécialiser

Réentraîner sur des exemples ciblés (ton, domaine, format).

Alignement = cadrer

Utile, honnête, prudent, sait refuser.

Compétent ≠ bien cadré

Il faut les deux, pas seulement la puissance.

À mesurer

Tout gain se valide par des évaluations réelles.

🫏 L'IA du Zéro🧑 Ado

Ma carte mémo

Fine-tuning et alignement

À la fin, ce sont ces idées qui doivent rester

Fine-tuning = spécialiserRéentraîner sur des exemples ciblés : ton, domaine, format.
Alignement = cadrerÊtre utile, honnête, prudent et savoir dire non.
Douée ≠ bien cadréeIl faut les deux, pas seulement la puissance.
On mesureChaque gain se vérifie avec de vrais tests.

iaduzero.fr — Comprendre l'IA, de zéro à expert 🇫🇷

Questions fréquentes

Les questions qu'on se pose souvent

Des réponses courtes et claires, sans jargon, pour lever les doutes.

C'est quoi le fine-tuning ?

Ré-entraîner un modèle existant sur des exemples ciblés pour le spécialiser (ton de marque, domaine, format) sans repartir de zéro.

C'est quoi l'alignement ?

Cadrer le comportement du modèle : être utile, honnête, prudent, et savoir refuser une demande dangereuse.

Faut-il toujours fine-tuner ?

Non. Souvent, un bon prompt ou du RAG suffit. Le fine-tuning se justifie quand on a vraiment besoin d'un ton ou d'un format spécifiques et stables.

L'alignement empêche-t-il toutes les erreurs ?

Non. Il oriente le comportement mais ne garantit pas l'exactitude. On le mesure avec des évaluations.

Continuer le parcours

La suite, pensée comme une montée en compréhension

On monte d'un cran à chaque étape, toujours avec la même promesse de clarté.

Voir la fiche

Évaluations et fiabilité

Pour mesurer si l'adaptation a vraiment amélioré le comportement.

Suite 1

Voir la fiche

Dense vs mixture-of-experts

Pour relier comportement et architecture du modèle.

Suite 2

Voir la fiche

Latence, coût et cache

Pour chiffrer le compromis en production.

Suite 3