Skip to main content
View as Markdown

Fournisseurs IA

Le fournisseur IA est le backend LLM (et d'embedding) qui propulse chaque capacité IA. Vous le sélectionnez avec des variables d'environnement — jamais dans le schéma de l'application. Définir AI_PROVIDER est l'interrupteur principal qui active toute la couche IA ; le laisser non défini maintient l'IA dormante.

AI_PROVIDER=anthropic
AI_API_KEY=sk-ant-...
AI_MODEL=claude-sonnet-4-5

Fournisseurs pris en charge

Fournisseur Valeur AI_PROVIDER Clé API requise URL de base requise Notes
Anthropic anthropic Oui Non Modèles Claude. Modèle par défaut : claude-sonnet-4-5.
OpenAI openai Oui Non Modèles GPT / série o. Modèle par défaut : gpt-4o.
Mistral mistral Oui Non Mistral / Codestral. Modèle par défaut : mistral-large-latest.
Google Gemini google (alias gemini) Oui Non Modèles Gemini. Modèle par défaut : gemini-2.0-flash.
Ollama ollama Non Oui Local, auto-hébergé. Aucune clé nécessaire. Modèle par défaut : llama3.1.
Compatible OpenAI openai-compatible Oui Oui Tout point d'accès parlant l'API OpenAI. Définissez AI_MODEL explicitement.

Variables d'environnement principales

Variable Description Exemple
AI_PROVIDER Identifiant du fournisseur. Interrupteur principal — non défini désactive toute l'IA. anthropic
AI_API_KEY Clé API pour les fournisseurs cloud. Non utilisée par Ollama. sk-ant-...
AI_BASE_URL URL du point d'accès. Requise pour Ollama et compatible OpenAI ; les fournisseurs cloud utilisent des valeurs par défaut intégrées. http://localhost:11434
AI_MODEL Modèle LLM par défaut. Bascule vers le modèle par défaut recommandé du fournisseur lorsque non défini. claude-sonnet-4-5
AI_TEMPERATURE Température d'échantillonnage par défaut, 01 inclus. 0.7
AI_MAX_TOKENS Nombre maximal de jetons de sortie par défaut (entier positif). 4096
AI_EMBEDDING_MODEL Modèle d'embedding pour le RAG. Bascule vers le modèle d'embedding du fournisseur par défaut. text-embedding-3-small
AI_EMBEDDING_DIMENSIONS Dimensions du vecteur (doit correspondre à la sortie du modèle d'embedding). 1536

Une valeur vide ou composée uniquement d'espaces est traitée de manière identique à une valeur non définie — les opérateurs qui vident AI_PROVIDER ont l'intention de le désactiver, et non de fournir une valeur invalide. Le serveur démarre proprement avec l'IA désactivée plutôt que de lever une erreur d'analyse.

Alias de clés et d'URL spécifiques aux fournisseurs

En plus des génériques AI_API_KEY / AI_BASE_URL, chaque fournisseur cloud accepte une variable d'environnement alias conventionnelle. La valeur générique AI_* a toujours la priorité ; l'alias est le repli.

Fournisseur Alias de clé API Alias d'URL de base
Anthropic ANTHROPIC_API_KEY
OpenAI OPENAI_API_KEY
Mistral MISTRAL_API_KEY
Google Gemini GOOGLE_API_KEY
Ollama — (pas de clé) OLLAMA_BASE_URL
Compatible OpenAI (utilise AI_API_KEY) (utilise AI_BASE_URL)

Modèles par défaut

Lorsque AI_MODEL n'est pas défini, chaque fournisseur résout vers une valeur par défaut raisonnable :

Fournisseur Modèle par défaut
Anthropic claude-sonnet-4-5
OpenAI gpt-4o
Mistral mistral-large-latest
Google Gemini gemini-2.0-flash
Ollama llama3.1
Compatible OpenAI aucun — définir AI_MODEL

Les points d'accès compatibles OpenAI pointent vers un backend arbitraire, il n'y a donc pas de modèle par défaut universel — vous devez définir AI_MODEL explicitement.

Validation des modèles

Pour les fournisseurs ayant un catalogue connu (Anthropic, OpenAI, Mistral, Google), Sovrium émet un avertissement de démarrage non fatal lorsque AI_MODEL (ou un remplacement model d'un agent) ne correspond pas à un modèle reconnu — typiquement une confusion inter-fournisseurs (gpt-4o sur anthropic) ou une faute de frappe (claud-sonet). C'est un avertissement, pas une erreur ; le serveur démarre quand même.

Les fournisseurs Ollama et compatible OpenAI ont des catalogues ouverts (modèles installés localement, points d'accès arbitraires), la validation du nom de modèle est donc entièrement ignorée pour eux.

Exemples de configuration

# Auto-hébergé, sans coût, frugal par défaut : Ollama local.
AI_PROVIDER=ollama
AI_BASE_URL=http://localhost:11434     # ou OLLAMA_BASE_URL
AI_MODEL=llama3.1
AI_EMBEDDING_MODEL=nomic-embed-text
# Anthropic avec un remplacement de température.
AI_PROVIDER=anthropic
ANTHROPIC_API_KEY=sk-ant-...           # ou AI_API_KEY
AI_MODEL=claude-sonnet-4-5
AI_TEMPERATURE=0.3
AI_MAX_TOKENS=4096
# Une passerelle compatible OpenAI (vLLM, LiteLLM, Azure OpenAI, etc.).
AI_PROVIDER=openai-compatible
AI_BASE_URL=https://my-gateway.internal/v1
AI_API_KEY=...
AI_MODEL=my-deployed-model             # requis — aucune valeur par défaut

Pages connexes