Arthur08 : pourquoi on a construit un agent IA pour les Carolomacériens
Arthur08 est un agent conversationnel que nous avons conçu pour aider les Carolomacériens à naviguer dans les services locaux et les démarches du quotidien. Voici pourquoi nous l'avons construit et comment il fonctionne.
Charleville-Mézières est une ville de 46 000 habitants, chef-lieu des Ardennes, dans le Grand Est. Comme beaucoup de villes moyennes françaises, elle dispose de services publics, d'associations, d'événements culturels, de démarches administratives — et d'une dispersion de l'information qui rend difficile de s'y retrouver. Horaires d'un service municipal, conditions d'accès à une aide sociale, agenda d'une salle de spectacle, fonctionnement de la collecte des déchets : l'information existe, mais elle est dispersée sur des dizaines de sites, de PDF, de pages Facebook, de documents administratifs.
C'est de ce constat qu'est né Arthur08. Un agent IA conversationnel, développé par Novilisya Solution, capable de répondre en langage naturel aux questions des Carolomacériens sur leur ville. Pas un chatbot à choix multiples avec des menus déroulants — un vrai agent qui comprend la question, cherche dans sa base de connaissances, et formule une réponse claire et utile.
Dans cet article, nous allons vous expliquer pourquoi nous avons construit Arthur08, comment il fonctionne techniquement, et ce que nous avons appris en le déployant.
Le problème que Arthur08 résout
Posez cette question à n'importe quel habitant de Charleville-Mézières : "Comment je fais pour déclarer mon chien en mairie ?" ou "Est-ce que le marché du samedi se tient aussi en hiver ?" ou encore "Quels sont les horaires de la médiathèque pendant les vacances scolaires ?"
La réponse commence toujours par : "Je pense que... mais vérifie sur le site." Le problème, c'est que le site de la ville est fourni, que la réponse est dans un PDF mis en ligne en 2022, que les horaires d'été ne sont pas encore mis à jour, et que l'utilisateur abandonne avant de trouver.
Ce phénomène de friction informationnelle n'est pas propre à Charleville-Mézières. Il concerne toutes les villes de taille moyenne. Et c'est un problème réel : des démarches non réalisées, des services sous-utilisés, une relation ville-habitant dégradée.
L'architecture RAG expliquée simplement
Arthur08 repose sur une architecture appelée RAG, pour Retrieval-Augmented Generation. C'est un terme technique qui désigne quelque chose d'assez intuitif une fois qu'on l'explique.
Un modèle de langage (comme GPT ou Claude) a été entraîné sur une grande quantité de texte. Il sait beaucoup de choses — mais pas les informations spécifiques à votre ville, votre entreprise, votre contexte. Si vous lui demandez "quels sont les horaires de la piscine de Charleville-Mézières", il va soit inventer une réponse plausible (ce qu'on appelle une hallucination), soit dire qu'il ne sait pas.
L'architecture RAG résout ce problème en deux étapes :
- La récupération (Retrieval) : quand l'utilisateur pose une question, le système cherche dans une base de connaissances locale les documents les plus pertinents. Cette base a été constituée en amont : pages du site de la ville, PDF administratifs, données horaires, fiches de services. La recherche utilise des techniques de similarité sémantique — ce qui veut dire qu'elle trouve des documents pertinents même si les mots exacts de la question ne s'y trouvent pas.
- La génération (Generation) : les documents pertinents trouvés sont fournis au modèle de langage comme contexte. Le modèle répond à la question en s'appuyant sur ces documents, pas sur ses données d'entraînement générales. Résultat : une réponse précise, sourcée, et à jour.
Concrètement pour Arthur08 :
- La base de connaissances contient les données de Charleville-Mézières : services municipaux, associations, événements, démarches, horaires.
- Cette base est mise à jour régulièrement (actuellement hebdomadairement) par des scripts automatisés qui récupèrent les données des sources officielles.
- Quand un habitant pose une question, Arthur08 cherche dans cette base et répond en citant ses sources.
Les choix techniques d'Arthur08
Le modèle de langage
Nous avons opté pour Claude d'Anthropic pour les réponses finales. Nos critères : qualité des réponses en français, comportement plus prudent sur les hallucinations que certains concurrents, et une politique d'usage conforme à nos besoins. Mistral est utilisé en backup pour certaines tâches de classification moins critiques.
La base vectorielle
Pour stocker et rechercher dans les documents, nous utilisons une base vectorielle (Qdrant, auto-hébergée). Chaque document est transformé en vecteur numérique — une représentation mathématique de son sens. La recherche trouve les documents dont le sens est proche de la question posée, même si les mots diffèrent.
L'interface utilisateur
Arthur08 est accessible via une interface web simple, optimisée mobile. L'interface est volontairement minimaliste : un champ de saisie, une zone de réponse, les sources citées en bas. Pas de menu, pas de catégories. L'utilisateur pose sa question en langage naturel, comme il le ferait à quelqu'un qu'il connaît.
La mise à jour des données
C'est la partie la plus délicate. Les informations sur une ville changent constamment : horaires modifiés, nouveaux services, événements. Un système dont les données sont obsolètes devient rapidement inutile, voire nuisible. Nous avons mis en place des scripts de scraping et d'import qui tournent chaque semaine et mettent à jour la base de connaissances automatiquement.
Ce que nous avons appris en déployant Arthur08
Les questions les plus posées ne sont pas celles qu'on attendait
Nous pensions que les questions administratives domineraient. En réalité, les premières semaines ont montré que les questions les plus fréquentes concernaient les horaires des commerces, les transports en commun, et les événements culturels. L'information pratique du quotidien prime sur l'information administrative.
La qualité de la base de connaissances est plus importante que la qualité du modèle
Un excellent modèle de langage avec une base de connaissances médiocre produit de mauvaises réponses. Une base de connaissances soignée avec un modèle correct produit de bonnes réponses. Le travail de constitution et de maintenance de la base documentaire est l'investissement le plus important d'un système RAG.
La confiance se construit par la transparence
Dès le début, nous avons fait le choix de toujours citer les sources dans les réponses d'Arthur08. Un lien vers la page officielle dont la réponse est extraite. Cela permet à l'utilisateur de vérifier, et cela ancre la réponse dans quelque chose de vérifiable. Ce choix a significativement amélioré la perception de fiabilité.
Les limites doivent être explicites
Arthur08 ne sait pas tout. Quand il ne trouve pas d'information pertinente dans sa base, il le dit clairement et oriente l'utilisateur vers la bonne ressource (numéro de téléphone d'un service, lien vers un formulaire). Un agent qui invente est bien plus dangereux qu'un agent qui admet ses limites.
Le potentiel au-delà de Charleville-Mézières
L'architecture d'Arthur08 est réplicable. Le même système peut être déployé pour d'autres villes, d'autres collectivités, d'autres organisations qui ont un corpus documentaire important et des utilisateurs qui ont du mal à s'y retrouver. Nous avons déjà eu des discussions avec plusieurs collectivités du Grand Est intéressées par ce type de déploiement.
Le même principe s'applique aussi en entreprise : une base de connaissances interne (procédures, politiques RH, documentation produit) accessible via un agent conversationnel. Nos produits Ardanya et LeadQualify utilisent d'ailleurs des architectures similaires dans des contextes commerciaux.
Construire votre propre agent IA
Si vous êtes une collectivité, une association, ou une entreprise des Ardennes et du Grand Est qui souhaite explorer ce type de solution, nous serions ravis d'en discuter. La mise en place d'un agent RAG adapté à votre contexte est aujourd'hui accessible, y compris pour des structures de taille modeste.
- Par téléphone : +33 6 08 84 34 50
- Par email : contact@novilisya.fr
- Par formulaire : explorer un projet agent IA
