Arthur08 : l'architecture technique d'un agent IA pour collectivité
Arthur08 est notre agent IA conçu pour les collectivités et services publics des Ardennes. Voici comment il est construit, pourquoi ces choix techniques, et ce que cela change pour les agents d'accueil.
Déployer un agent IA dans une collectivité publique n'est pas la même chose que de l'intégrer dans une startup. Les contraintes sont fondamentalement différentes : des usagers aux profils très variés (personnes âgées, non-francophones natifs, situations de détresse), des données sensibles à ne pas exposer, une obligation de neutralité et d'exactitude, et des interlocuteurs institutionnels qui ne peuvent pas se permettre qu'un outil réponde avec des informations fausses sur des procédures administratives.
Arthur08 est l'agent IA que Novilisya Solution a conçu spécifiquement pour ce contexte. Il est déployé depuis début 2026 auprès de plusieurs structures ardennaises pour assister les agents d'accueil et répondre aux demandes d'information des administrés en dehors des heures d'ouverture.
Cet article détaille les choix techniques qui ont guidé sa conception, les problèmes que nous avons rencontrés, et les solutions que nous avons mises en place.
Le problème de départ : des agents d'accueil surchargés
Les agents d'accueil dans les collectivités ardennaises traitent une grande partie de demandes récurrentes : état civil, démarches d'urbanisme, aide sociale, informations pratiques sur les services locaux. Ces demandes représentent souvent 60 à 70% du volume total, alors que leurs réponses sont contenues dans des documents déjà existants (guides, délibérations, formulaires).
L'objectif n'était pas de remplacer les agents humains — c'est une position que nous défendons fermement — mais de leur épargner les questions à faible valeur ajoutée pour qu'ils se concentrent sur les situations complexes qui nécessitent un jugement humain.
L'architecture technique d'Arthur08
Le LLM de base
Arthur08 est construit sur Claude 3.5 Sonnet d'Anthropic, avec des fine-tunings spécifiques pour le vocabulaire administratif français et les formulations propres aux collectivités territoriales. Le choix d'Anthropic tient à plusieurs facteurs : fiabilité sur les tâches de raisonnement en français, politique de confidentialité des données compatible avec le RGPD européen, et les Constitutional AI principles qui réduisent les risques de sorties problématiques.
La base documentaire et le pipeline RAG
La couche RAG (Retrieval-Augmented Generation) est le coeur du système. Le principe : Arthur08 ne répond jamais "de mémoire". Pour chaque question, il interroge d'abord une base de documents officiels fournis par la collectivité, récupère les passages les plus pertinents, et construit sa réponse exclusivement à partir de ces sources vérifiées.
La base vectorielle
Les documents sont stockés dans Qdrant, une base vectorielle open source que nous hébergeons en infrastructure propre (et non sur un cloud américain, pour des raisons de souveraineté des données). Chaque document est découpé en chunks de 500 à 800 tokens, encodé par un modèle d'embedding multilingue (multilingual-e5-large), et indexé avec ses métadonnées (source, date de mise à jour, domaine thématique).
Lors d'une requête, la question de l'usager est elle-même encodée, et un calcul de similarité cosinus identifie les 5 à 10 chunks les plus proches sémantiquement. Ces chunks sont injectés dans le contexte de Claude avant de générer la réponse.
Le reranking
La recherche vectorielle seule n'est pas suffisamment précise pour des questions administratives où les termes exacts ont une importance légale. Nous avons ajouté une étape de reranking : après la recherche vectorielle, un modèle de cross-encoding (ms-marco-MiniLM-L-6-v2 adapté en français) reclasse les résultats selon leur pertinence par rapport à la question exacte. Cela réduit significativement les hallucinations par interpolation de sources mal ciblées.
Les garde-fous : la partie la plus critique
Dans un contexte de service public, un agent qui hallucine des informations sur une procédure administrative peut causer un préjudice réel à un usager. Nous avons donc mis en place plusieurs niveaux de garde-fous.
La détection de confiance
Chaque réponse générée par Arthur08 est accompagnée d'un score de confiance calculé à partir de : la similarité des chunks récupérés (score RAG), la cohérence interne de la réponse générée (évaluée par un prompt de vérification secondaire), et l'absence de signaux de contradiction entre les sources.
En dessous d'un seuil de confiance paramétrable (fixé à 0.72 dans la configuration actuelle), Arthur08 n'invente pas de réponse. Il informe l'usager qu'il ne dispose pas d'une information suffisamment fiable sur ce sujet et lui propose de contacter directement le service compétent, avec les coordonnées correctes.
Les topics interdits
Un système de classification préalable analyse chaque message entrant avant qu'Arthur08 y réponde. Si le message touche à des domaines hors périmètre (conseil juridique individualisé, situations d'urgence médicale, demandes de données personnelles tierces), il est immédiatement rerouté vers un agent humain avec un message d'explication à l'usager.
La journalisation complète
Chaque échange est journalisé avec la question, la réponse, les chunks sources utilisés, les scores de confiance, et l'identifiant de session anonymisé. Cette journalisation permet aux agents de la collectivité de contrôler la qualité des réponses, d'identifier les zones de documentation insuffisante, et de tracer tout incident éventuel.
Le déploiement et l'intégration
Interface multi-canal
Arthur08 est accessible via trois canaux : un widget embarqué sur le site web de la collectivité, une interface web dédiée accessible aux agents d'accueil pour assister leurs réponses en temps réel, et une API REST que les collectivités peuvent intégrer dans leurs propres outils internes.
Mise à jour de la base documentaire
Un point critique souvent sous-estimé : la maintenance de la base documentaire. Les procédures administratives changent régulièrement. Nous avons mis en place un pipeline de mise à jour semi-automatique : les référents documentaires de la collectivité peuvent uploader de nouveaux documents ou marquer des documents comme obsolètes via une interface d'administration. Le pipeline re-chunke, ré-encode et réindexe automatiquement. Le délai entre l'upload d'un document et sa disponibilité dans les réponses d'Arthur08 est inférieur à 5 minutes.
Les résultats après 3 mois de déploiement
- 68% des demandes d'information traitées entièrement par Arthur08 sans intervention humaine
- Taux de satisfaction usager : 4,1 / 5 sur les interactions clôturées par Arthur08
- Réduction de 40% des appels téléphoniques entrants sur les questions d'information générale
- 0 incident lié à une hallucination ou une information erronée sur des procédures — grâce au système de score de confiance
Ce que nous avons appris
La qualité de la base documentaire est le facteur limitant principal. Un LLM performant avec une documentation incomplète ou mal structurée donnera des résultats médiocres. L'investissement dans la préparation et la structuration des documents sources est au moins aussi important que l'architecture technique.
Le second enseignement : les usagers apprécient la transparence. Quand Arthur08 dit "je ne suis pas certain de cette information, voici le contact du service compétent", le taux de satisfaction reste élevé. Les usagers comprennent les limites d'un outil numérique — ce qu'ils ne tolèrent pas, c'est une information fausse donnée avec assurance.
Vous travaillez dans une collectivité, un EPCI, ou un service public ardennais et vous évaluez des solutions similaires ? Contactez-nous pour une démonstration d'Arthur08 dans votre contexte : contact@novilisya.fr — +33 6 08 84 34 50 — Demander une démo
