Routage éco IA
Sovrium traite l'empreinte environnementale comme une propriété de plateforme de premier ordre. L'inférence IA est l'une des opérations les plus gourmandes en ressources qu'une plateforme puisse effectuer, c'est pourquoi Sovrium route les appels IA local d'abord par défaut : lorsqu'un modèle local (Ollama) est accessible, il répond ; ce n'est que lorsqu'il ne l'est pas que l'appel bascule vers un fournisseur cloud configuré.
Ceci est contrôlé par une seule variable d'environnement d'opérateur — ECO_AI_PROVIDER_PRECEDENCE — jamais par le schéma de l'application. Comme toute variable ECO_*, sa valeur par défaut est le réglage aligné sur l'écologie ; les opérateurs se désengagent, jamais ne s'engagent.
ECO_AI_PROVIDER_PRECEDENCE=local-first # la valeur par défaut — généralement à omettre entièrement
AI_PROVIDER=anthropic # cible de repli cloud
ANTHROPIC_API_KEY=sk-ant-...
OLLAMA_BASE_URL=http://localhost:11434 # point d'accès du fournisseur local
Modes de précédence
| Valeur | Comportement |
|---|---|
local-first |
(par défaut) Privilégier un Ollama local accessible ; basculer vers le fournisseur cloud AI_PROVIDER configuré lorsque Ollama est inaccessible. |
cloud-first |
Utiliser le fournisseur cloud configuré ; utiliser un Ollama accessible uniquement lorsqu'aucun fournisseur cloud n'est configuré. |
local-only |
Utiliser un fournisseur local exclusivement. Les appels IA n'ont aucun repli cloud — lorsqu'aucun Ollama accessible n'est configuré, l'IA est indisponible. |
Une valeur non définie, vide ou non reconnue résout vers la valeur par défaut alignée sur l'écologie, local-first.
Comment le routage se résout
Le résolveur combine trois entrées : la précédence active, si un point d'accès Ollama est configuré (via OLLAMA_BASE_URL, ou AI_BASE_URL lorsque AI_PROVIDER=ollama), et si la sonde d'accessibilité de l'exécution a trouvé Ollama utilisable (configuré et répondant).
| Précédence | Ollama utilisable | Cloud configuré | Route vers | Notes |
|---|---|---|---|---|
local-first |
oui | — | Ollama | Chemin local privilégié. |
local-first |
non | oui | cloud | Repli. Signalé avec une raison lorsqu'Ollama était configuré mais inaccessible. |
local-first |
non | non | Ollama / aucun | Désactivé lorsqu'aucun fournisseur n'est configuré du tout. |
cloud-first |
— | oui | cloud | Le cloud l'emporte toujours lorsqu'il est configuré. |
cloud-first |
oui | non | Ollama | Local utilisé uniquement parce qu'aucun cloud n'est configuré. |
local-only |
oui | — | Ollama | Local exclusivement. |
local-only |
non | — | aucun | Aucun repli — IA indisponible jusqu'à ce qu'un Ollama accessible existe. |
L'accessibilité est sondée, pas supposée. L'exécution vérifie si le point d'accès Ollama configuré répond réellement avant de router vers lui. Sous local-first, lorsqu'Ollama est configuré mais inaccessible, le repli vers le cloud est enregistré avec une raison destinée à l'opérateur ; lorsqu'Ollama n'a jamais été configuré, le repli se produit silencieusement.
Observabilité
La décision de routage éco active est exposée sur le point d'accès de santé (GET /api/health, sous body.ai) :
| Champ | Signification |
|---|---|
precedence |
La valeur ECO_AI_PROVIDER_PRECEDENCE active. |
resolvedProvider |
Le fournisseur canonique vers lequel les appels IA sont routés (ou absent lorsque l'IA est désactivée). |
ollamaReachable |
Si la sonde Ollama locale a réussi. |
configured |
La valeur brute AI_PROVIDER. |
fallbackReason |
Pourquoi le résolveur a basculé vers un fournisseur non privilégié (présent uniquement en cas de repli). |
Cela rend le routage auditable : les opérateurs peuvent confirmer si un déploiement s'exécute réellement sur son modèle local ou consomme silencieusement des jetons cloud.
Exemples de configuration
# Valeur par défaut frugale : Ollama local avec un filet de sécurité Anthropic.
# (ECO_AI_PROVIDER_PRECEDENCE=local-first est la valeur par défaut — affichée pour clarté.)
ECO_AI_PROVIDER_PRECEDENCE=local-first
AI_PROVIDER=anthropic
ANTHROPIC_API_KEY=sk-ant-...
OLLAMA_BASE_URL=http://localhost:11434
AI_MODEL=claude-sonnet-4-5
# Déploiement strict local-only — aucune donnée ne quitte jamais l'hôte.
ECO_AI_PROVIDER_PRECEDENCE=local-only
AI_PROVIDER=ollama
AI_BASE_URL=http://localhost:11434
AI_MODEL=llama3.1
# Qualité d'abord : toujours utiliser le fournisseur cloud.
ECO_AI_PROVIDER_PRECEDENCE=cloud-first
AI_PROVIDER=openai
OPENAI_API_KEY=...
AI_MODEL=gpt-4o
Pages connexes
- Fournisseurs IA — configuration du fournisseur, de la clé et de l'URL de base.
- Vue d'ensemble de l'IA — l'écosystème IA et la philosophie de configuration.
- Variables d'environnement — référence complète
ECO_*etAI_*.