Le modèle seul ne garde rien entre deux sessions.
La mémoire d'un assistant
Comprendre pourquoi un modèle n'a pas de mémoire native, et comment un produit lui en donne une.
🫏 Commence par la BD, c'est plus rigolo ! 🫏 Cette notion existe aussi en BD 🫏 Cette notion existe aussi en BD « IA perd la mémoire (encore) » — lire l'histoire →
Le produit capture l'essentiel : préférences, faits, résumés.
Ces notes sont stockées puis récupérées quand c'est utile.
L'assistant n'a pas de mémoire, on lui en bricole une
- Tout seul, le modèle repart de zéro à chaque nouvelle conversation : il ne te « connaît » pas vraiment.
- Mémoire courte = ce qui tient dans la conversation en cours (sa « fenêtre »). Trop long, et le début finit par sortir.
- Mémoire longue = des notes (ton prénom, tes goûts, un résumé) stockées par l'appli, puis relues plus tard.
- L'appli ne ressort que ce qui est utile au moment voulu, pas tout le carnet d'un coup.
Sur un assistant qui t'aide pour les devoirs, il « retient » que tu es en 3e et que tu révises l'Histoire. En vrai, ce n'est pas lui : l'appli a noté ça dans un coin et le lui rappelle au début de chaque session. Pareil qu'une appli de musique qui se souvient de tes playlists.
Cette « mémoire » est stockée quelque part par l'entreprise. Avant de confier des trucs perso (adresse, problèmes intimes, mots de passe), demande-toi : est-ce que je veux que ce soit gardé ? Va voir les réglages : tu peux souvent consulter, désactiver ou effacer ce que l'assistant a mémorisé sur toi.
Deux mémoires : la courte (la conversation actuelle) et la longue (des notes rangées dehors, ré-injectées au bon moment).
Regarde l'assistant se souvenir… ou repartir de zéro
Sans mémoire, il t'oublie d'une session à l'autre. Active le « carnet » et vois le produit lui relire ton prénom et tes goûts.
Pendant cette conversation, je vois cette info (mémoire courte = fenêtre de contexte).
Sous le capot Pour les curieux : ce qui se passe à l'intérieur
Tape pour explorer Replier
Sa mémoire de tout de suite, c'est juste ce qu'on lui dit
Pendant que tu lui parles, l'âne se souvient de ce que tu viens de raconter, comme quand tu retiens une histoire qu'on est en train de te lire. Mais si ça devient trop long, le début s'envole de sa tête, pile comme quand tu oublies le tout premier mot d'une grande phrase.
Pour se souvenir longtemps, on écrit dans un carnet
Pour ne pas tout oublier quand tu pars, on note des petites choses sur un carnet : « Léa aime les chats ». Le carnet n'est pas dans la tête de l'âne, il est posé à côté. C'est le carnet qui se souvient, pas lui tout seul !
On relit juste les pages qui servent
Si on lui relisait TOUT le carnet à chaque fois, ce serait trop long et il s'embrouillerait. Alors on choisit juste la bonne page : celle qui parle de ce dont tu as besoin aujourd'hui, comme quand tu cherches une seule image dans ton album.
Garder tes secrets, c'est important
Écrire des choses sur toi, c'est sérieux. Il faut faire attention : qu'est-ce qu'on a le droit de noter, et quand est-ce qu'on doit gommer le carnet ? On ne garde pas tout, juste ce qui aide, et on peut effacer quand tu veux.
La mémoire courte, c'est la fenêtre de contexte
Pendant une conversation, le modèle « voit » tout l'historique tant qu'il rentre dans sa fenêtre de contexte (la quantité de texte qu'il peut lire d'un coup, un peu comme un nombre de messages max). Quand ça déborde, le plus ancien est coupé ou résumé, et il disparaît — comme un fil de discussion qui charge seulement les derniers messages.
La mémoire longue est stockée à l'extérieur
Pour se souvenir d'une session à l'autre, on enregistre des faits, des préférences ou des résumés dans une base de données (un stockage externe), puis on va les rechercher plus tard. C'est l'appli autour du modèle qui « se souvient », pas le modèle : lui redémarre à zéro à chaque fois.
On ne ré-injecte que le pertinent
Renvoyer toutes les notes saturerait la fenêtre et noierait l'info utile. On sélectionne donc seulement ce qui colle à la situation, puis on le remet dans le contexte. C'est le principe du RAG (Retrieval-Augmented Generation) appliqué à toi : on récupère la bonne note au bon moment, comme une recherche ciblée.
Mémoriser engage la responsabilité
Stocker des infos perso impose des choix sérieux : que garde-t-on, combien de temps, et comment permettre l'effacement (le droit à l'oubli, encadré par le RGPD). Une mémoire utile ne veut pas dire tout retenir : on garde le strict nécessaire et on doit pouvoir tout supprimer sur demande.
La mémoire courte, c'est la fenêtre de contexte
Pendant une conversation, le modèle voit l'historique tant qu'il tient dans la fenêtre. Au-delà, on tronque ou on résume — et l'ancien sort.
La mémoire longue est stockée à l'extérieur
On enregistre des faits, des préférences ou des résumés dans une base, puis on les récupère plus tard. C'est le produit, pas le modèle, qui « se souvient ».
On ne ré-injecte que le pertinent
Tout ressortir noierait la fenêtre. On sélectionne les notes utiles à la situation (comme du RAG centré sur l'utilisateur) et on les remet dans le contexte.
Mémoriser engage la responsabilité
Stocker des informations personnelles impose des choix : que garde-t-on, combien de temps, comment permettre l'effacement. Mémoire utile ne veut pas dire tout retenir.
L'analogie qui aide à retenir
C'est comme un ami très gentil qui oublie tout, sauf si on lui tient un carnet.
L'assistant est un pote génial mais amnésique : sa mémoire, c'est les notes que l'appli garde et lui relit.
L'assistant est un génie amnésique : sa mémoire, c'est le carnet de notes qu'on tient pour lui et qu'on lui relit.
Le coeur de l'idée
La machine ne se souvient pas toute seule : c'est le carnet qu'on lui relit.
Un assistant ne se souvient pas tout seul : c'est l'appli autour qui range des notes et les lui relit.
Un assistant ne se souvient pas tout seul : sa mémoire est un dispositif autour du modèle, à concevoir avec soin.
Le mécanisme, découpé étape par étape
La machine oublie tout quand tu pars.
Alors on écrit ce qui compte sur un petit carnet.
On garde le carnet bien au chaud.
Avant de répondre, elle relit le carnet pour se rappeler.
Tout seul, le modèle oublie tout dès que tu fermes la conversation.
L'appli autour de lui note l'essentiel : ton prénom, tes préférences, un résumé.
Ces notes sont rangées quelque part, puis ressorties quand elles servent.
On les remet au début de la discussion pour donner l'impression qu'il se souvient.
Seul, le modèle ne conserve rien d'une session à l'autre : il repart de zéro.
Le produit capture l'essentiel : préférences, faits importants, résumés d'échanges.
Ces notes sont stockées à l'extérieur, puis récupérées quand elles sont utiles.
On ne ré-injecte dans le contexte que le pertinent, pour simuler une mémoire.
Exemples très concrets Où tu retrouves ça dans le monde réel
Tape pour explorer Replier
Le carnet dit : « Léa adore le vélo », alors elle s'en souvient.
Il note ton dessin animé préféré pour t'en reparler.
Il garde le nom de ton doudou pour ne pas l'oublier.
Ton appli de révision retient en quelle classe tu es et les matières que tu bosses.
Un chatbot d'aide aux devoirs se rappelle que tu préfères les explications courtes.
Ton assistant de jeu garde ton pseudo et ton style préféré entre deux parties.
Un assistant retient ton prénom et ton objectif d'apprentissage.
Un support client se souvient de tes derniers tickets pour ne pas tout reposer.
Un copilote de code garde tes conventions de nommage préférées.
Points de vigilance Ce qu'il ne faut pas confondre
Tape pour explorer Replier
Si le carnet a une bêtise dedans, elle redit la bêtise.
Garder trop de secrets, ce n'est pas bien.
Si elle lit la mauvaise page, elle se trompe.
Une note fausse ou périmée peut ressortir et fausser la réponse.
Tout stocker coûte cher et expose des infos perso.
La mémoire longue ne sert à rien si l'appli retrouve la mauvaise note.
Une mémoire mal gérée peut ressortir des infos fausses ou périmées.
Tout stocker coûte cher et pose des risques de vie privée.
La mémoire longue n'est fiable que si la récupération l'est.
Remplace les fausses idées par les bonnes
On corrige les réflexes faux que beaucoup gardent, pour ancrer une image mentale juste et solide.
On croit qu'elle se souvient toute seule.
En vrai, c'est le carnet qui se souvient. Elle, elle oublie tout.
On croit que tout noter, c'est mieux.
En vrai, si on note trop, le carnet se trompe et raconte des bêtises.
« L'assistant me connaît, donc il se souvient tout seul. »
Non : c'est l'appli qui garde les notes et les lui relit. Le modèle, lui, recommence à zéro à chaque fois.
« Plus il mémorise de trucs, mieux c'est. »
Faux : tout garder coûte cher, peut ressortir des infos périmées et touche à ta vie privée.
« Avec de la mémoire, l'IA ne se trompe plus. »
Non : si elle ressort une note fausse ou vieille, elle se plante. La mémoire ne vaut que si on retrouve la bonne note.
« L'assistant me connaît, donc il se souvient tout seul. »
Non. C'est le produit qui garde des notes et les lui relit ; le modèle repart de zéro à chaque session.
« Plus on mémorise, mieux c'est. »
Pas vraiment. Tout retenir coûte cher, peut ressortir des infos périmées et pose des risques de vie privée.
« La mémoire rend l'IA infaillible. »
Non. Une mémoire mal récupérée peut injecter des infos fausses : elle n'est fiable que si la récupération l'est.
À la fin, ce sont ces idées qui doivent rester
Si tu peux les redire sans relire la fiche, l'essentiel est acquis.
Quand tu pars, la machine ne sait plus qui tu es.
On écrit ce qui compte dans un petit carnet.
Avant de parler, elle regarde le carnet.
On ne note pas tout, juste ce qui sert vraiment.
À la fin, ce sont ces idées qui doivent rester
Si tu peux les redire sans relire la fiche, l'essentiel est acquis.
Le modèle repart de zéro à chaque conversation.
Courte = la conversation en cours. Longue = des notes gardées entre les sessions.
On ne remet que les notes utiles, pas tout, sinon ça déborde.
Que garder, combien de temps, comment effacer.
À la fin, ce sont ces idées qui doivent rester
Si tu peux les redire sans relire la fiche, l'essentiel est acquis.
Le modèle repart de zéro entre les sessions.
Fenêtre de contexte (en cours) vs notes stockées (entre sessions).
Comme un RAG centré sur l'utilisateur : on retrouve ce qui compte.
Que garder, combien de temps, comment permettre l'effacement.
Les questions qu'on se pose souvent
Des réponses courtes et claires, sans jargon, pour lever les doutes.
Un assistant se souvient-il vraiment de moi ?
Pas le modèle lui-même. C'est le produit autour qui garde des notes (prénom, préférences) et les lui relit au bon moment.
Différence entre mémoire courte et longue ?
La mémoire courte est la fenêtre de la conversation en cours. La mémoire longue est faite de notes stockées et réutilisées entre les sessions.
La mémoire peut-elle se tromper ?
Oui. Si on récupère une note fausse ou périmée, l'assistant s'appuiera dessus. La mémoire n'est fiable que si la récupération l'est.
Et la vie privée ?
Mémoriser des données personnelles impose des règles : choisir ce qu'on garde, la durée, et permettre l'effacement (droit à l'oubli).
La suite, pensée comme une montée en compréhension
On monte d'un cran à chaque étape, toujours avec la même promesse de clarté.