Mémoire IA
La mémoire d'agent donne à un agent un contexte qui persiste au-delà d'un seul message. Elle est configurée sous le bloc memory d'un agent et est composée de trois niveaux indépendants, chacun désactivé par défaut et activé individuellement. Avant que l'exécution n'invoque le LLM (par exemple, lorsque l'action d'automatisation ai:agent dispatche une tâche), elle assemble le contexte à partir des niveaux activés.
| Niveau | Persistance | Direction | Objectif |
|---|---|---|---|
conversation |
Niveau session (éphémère, fenêtré) | Lecture | Maintenir le contexte de dialogue à travers les messages récents. |
knowledge |
Sources RAG en lecture seule | Lecture | Récupérer des documents pertinents via la recherche sémantique. |
facts |
Persistant à travers les sessions | Lecture/écriture | Mémoriser les faits gérés par l'IA que l'agent apprend au fil du temps. |
agents:
- name: support-agent
role: support
systemPrompt: Be helpful and remember the customer's preferences.
memory:
conversation:
enabled: true
windowSize: 10
summarize: true
knowledge:
enabled: true
sources: [faq, docs]
retrievalLimit: 5
similarityThreshold: 0.7
facts:
enabled: true
maxFacts: 100
namespace: support
Mémoire de conversation
Retient les messages récents de la session de l'agent. Lorsqu'elle est activée, l'exécution charge les windowSize derniers messages dans le contexte avant chaque invocation.
| Propriété | Défaut | Description |
|---|---|---|
enabled |
false |
Si la mémoire de conversation est active. |
windowSize |
10 |
Nombre de messages récents conservés dans le contexte. |
summarize |
false |
Lorsque true, les messages plus anciens sont compressés en résumé au lieu d'être abandonnés. |
Mémoire de connaissances
Récupération sémantique basée sur RAG depuis les sources de connaissances configurées. Lorsqu'elle est activée, l'exécution exécute une recherche par similarité contre les sources listées avant chaque invocation et injecte les documents les plus pertinents dans le contexte. C'est le côté récupération à l'exécution du RAG — distinct du bloc knowledge de l'agent, qui définit les sources d'entrée qui sont intégrées.
| Propriété | Défaut | Description |
|---|---|---|
enabled |
false |
Si la récupération de connaissances est active. |
sources |
— | Noms des sources de connaissances à rechercher (doivent référencer des bases de connaissances configurées). |
retrievalLimit |
5 |
Nombre maximal de documents récupérés par requête. |
similarityThreshold |
0.7 |
Score de similarité minimal (0–1) pour qu'un document récupéré soit inclus. |
La mémoire de connaissances réutilise le pipeline RAG. La récupération s'exécute contre le même magasin vectoriel décrit dans RAG IA — pgvector sur PostgreSQL ou BLOB Float32 + cosinus côté application sur SQLite.
Mémoire de faits
Faits clé-valeur persistants que l'agent apprend à travers les sessions. Contrairement à l'action d'automatisation state (KV défini explicitement par le développeur), les faits sont gérés par l'IA : l'agent lui-même décide ce qui vaut la peine d'être mémorisé. Les faits sont récupérés par pertinence sémantique à la tâche courante, et non par recherche de clé exacte.
| Propriété | Défaut | Description |
|---|---|---|
enabled |
false |
Si la mémoire de faits est active. |
maxFacts |
100 |
Nombre maximal de faits que l'agent peut stocker. |
namespace |
nom de l'agent | Espace de noms pour l'isolation des faits. Minuscule, commence par une lettre (^[a-z][a-z0-9-]*). |
Isolation d'espace de noms & restriction par utilisateur
Les faits sont partitionnés par namespace (par défaut le nom de l'agent), de sorte que deux agents ne lisent jamais les faits appris l'un de l'autre. Combiné au modèle agent-en-tant-qu'utilisateur — chaque agent est un auth.user distinct — cela donne une isolation des faits par agent et, lorsque le chat restreint par session, par utilisateur. Un agent ne peut pas faire fuiter les faits appris d'un client dans la conversation d'un autre client.
Composition des niveaux
Les trois niveaux sont optionnels et se combinent librement. Un agent analyste en lecture seule pourrait n'activer que knowledge ; un agent de support de longue durée pourrait activer les trois. Lorsque plusieurs niveaux sont activés, l'exécution assemble le contexte à partir de chacun avant d'invoquer le LLM :
conversation (dialogue récent)
+
knowledge (documents récupérés sémantiquement)
+
facts (faits appris pertinents)
▼
contexte assemblé → LLM
Pages connexes
- Agents IA — l'agent auquel appartient le bloc
memory. - RAG IA — le pipeline d'embedding/récupération que la mémoire de connaissances utilise.
- Chat IA — historique de conversation dans l'interface de chat.
- Vue d'ensemble de l'IA — l'écosystème IA complet.