Anthropic API · prod Discipline 05 · Manuel des expertises Prototype offert (PoC)
IA pour tâches complexes IA pour workflows courants + filet de sécurité automatique

L'IA mise au travail,
durablement.
Pas un chatbot dans un coin.

On branche Claude là où ça compte vraiment : vos emails entrants, vos factures, vos tickets SAV, vos relances. Avec des garde-fous humains aux moments critiques, un audit complet de chaque décision IA, et zéro hallucination en prod. Le tout dans votre code Django, sous votre domaine.

Pour démarrer PoC offert bien moins cher qu'un abonnement no-code

Tests de qualité automatiques inclus · monitoring · audit logs RGPD

  Activity feed · live Worker · eu-west-3
Workflow #CDM-2387 · email → devis CRM Running
01

Email reçu

Trigger · IMAP / webhook

Listening
02

Claude extrait

Intent · contact · besoin

Idle
03

CRM devis

Django ORM · API interne

Idle
04

Réponse envoyée

Sendgrid · log + audit

Idle

Réponse

rapide

Fiabilité

élevée

Suivi 30j

inclus

Assistants qui répondent à partir de VOS documents Triage email automatisé Extraction factures & contrats Classification tickets SAV Génération brief SEO Workflows métier sur mesure Zéro réponse inventée en production

Ce qu'on observe sur le terrain

Les quatre IA
que tout le monde déploie
(et qui ne tiennent pas).

Quatre patterns observés sur la quasi-totalité des projets IA d'entreprise que nous reprenons en 2026. Tous ont la même fin : dette technique, hallucinations en prod, client mécontent.

01

ChatGPT bricolé dans un coin du site

Un widget collé dans un footer, branché sur l'API d'OpenAI avec une clé exposée côté front. Zéro intégration avec les données métier, zéro garde-fou, et il invente joyeusement le délai de livraison ou le prix d'un produit qui n'existe pas. Premier réflexe : le décrocher dans le mois.

Fiabilitéfaible Hallucine en prod
02

Zapier qui devient ingérable

250 zaps actifs, accumulés sur cinq ans, plus personne ne sait qui fait quoi. Un déclencheur tombe en panne, deux process s'écroulent en cascade, et l'addition mensuelle devient plus chère que ce qu'elle économise. L'outil n'était pas conçu pour scaler.

Zaps actifsingérables Coûtcroissant
03

L'agent commercial IA qui hallucine sur vos données

Un assistant branché sur vos documents, mais mal configuré : base documentaire mal indexée, découpage approximatif, aucune citation de source. L'agent répond avec assurance des choses fausses sur vos produits — et le client le croit. Le pire des deux mondes.

Aucune source citée
04

Le no-code IA qui ne tient pas la charge

Lindy, Sweep, Cassidy. C'est joli en démo, ça ne tient pas en production. Vous louez une plateforme, vous vous retrouvez verrouillé sur leurs intégrations, leurs limites, leurs engagements de disponibilité. Le jour où vous voulez adapter : bloqué. Le jour où ils ferment : tout repart à zéro.

Dette techniquecachée

Quatre patterns. Quatre échecs. Tous évitables — si on conçoit l'IA comme un composant de votre stack, pas comme un gadget plaqué sur le côté.

— Note de l'atelier

Manifeste IA

Cinq principes.
Aucune négociation.

Notre charte d'usage de l'IA, qu'on signe avec chaque client en début de projet. Si l'un de ces cinq points pose problème, on ne sera probablement pas le bon atelier — et on préfère le savoir avant que vous ne signiez.

01

L'IA sert une tâche métier précise.

Pas l'inverse. On ne fait pas du saupoudrage « et si on mettait de l'IA partout ». On part d'une tâche manuelle douloureuse, mesurable, et on la réécrit en une chaîne d'étapes automatisées. Le reste du site reste 100 % code Django sans IA.

02

Garde-fous humains aux moments critiques.

On définit ensemble un seuil de certitude en dessous duquel l'IA ne décide plus seule. Toute situation ambiguë est systématiquement remontée à un humain avant action. C'est paramétrable, c'est explicite, c'est audité.

03

Audit complet de chaque décision IA.

Qui a décidé. Sur quel prompt. Avec quelle réponse. Avec quel niveau de certitude. Quel coût. Tout est loggué en base, exportable, requêtable. Si un client conteste, on retrouve la trace en 5 secondes.

04

Vos données restent dans votre périmètre.

RGPD natif. Pas d'envoi à des modèles d'IA hors UE sans accord explicite. Pas d'entraînement de l'IA sur vos données client. Anthropic Bedrock (UE) ou Anthropic API sans conservation des données selon le besoin — discuté en J0, écrit au contrat.

05

Évolution itérative, pas big bang.

On commence par une seule tâche automatisée, sur 10 % du volume. On mesure 4 semaines. Si les résultats sont bons, on monte à 100 %. Sinon, on revient en arrière sans drame. C'est la seule façon de ne pas se planter.

Un seul interlocuteur sur tout le cycle.

Cadrage IA, spec, code, déploiement, monitoring. Un seul humain (moi) du début à la fin. Pas de chef de projet qui transmet à un dev qui sous-traite à un junior. Le résultat de l'IA dépend trop de la finesse de l'intention pour mettre 4 cerveaux dessus.

Pour qui ?

Quatre typologies
qu'on sait livrer
rapidement.

Tous les besoins IA ne se valent pas : certains sont mûrs, d'autres demandent encore un cadrage. Voici les quatre cas où nous savons livrer un PoC solide, avec un ROI mesurable sur la durée.

01 · Commerçant

Automatiser les relances & devis

Vous passez 8 heures par semaine à rédiger des devis et relancer des prospects. L'IA pré-rédige tout depuis un email entrant, vous validez, vous envoyez. Le ton reste le vôtre, la décision aussi.

Résultat mesuré plusieurs heures récupérées par semaine

02 · Service client

Absorber le support de premier niveau

Un assistant branché sur votre doc produit, FAQ, conditions générales. Il répond en moins de 5 secondes aux questions répétitives — et reconnaît quand il faut basculer en humain. Pas de réponse inventée.

Réponse moy. < 5 s

03 · Éditorial

Augmenter la cadence SEO

Génération de briefs SEO complets (intent, plan, sémantique), correction stylistique, suggestions de maillage. Jamais de publication directe. Toujours une relecture humaine — la marque parle, pas la machine.

Résultat mesuré cadence de production nettement accrue

04 · Métier expert

Extraire & structurer du document

Auto-tagging d'articles, classification de tickets, extraction de factures/contrats dans un format prêt à intégrer dans vos outils. Traitement fiable : vos PDF deviennent des fiches requêtables dans votre application.

Résultat mesuré extraction fiable, validée avant prod

Catalogue d'agents

Six agents.
Six métiers
opérationnels.

Ce que nous construisons concrètement : six types d'automatisations, chacun démarré par un PoC offert. Tout s'intègre à votre environnement existant, avec ses garde-fous, son suivi et son tableau de bord — sans dépendance à un outil tiers.

Cs

Customer Support

Agent · niveau 1

Répond à partir de vos documents + bascule vers un humain dès que la situation est ambiguë. Cite ses sources, garde l'historique de la conversation, sait dire « je ne sais pas ».

Réponse
rapide
Auto-résol.
bonne
Sources
citées
St

Sales Triage

Agent · pré-qualif

Lit chaque email entrant, qualifie (chaud / tiède / hors-cible), extrait les infos clés, crée une fiche prospect dans le CRM avec un score d'urgence.

Précision
élevée
Volume
fort
Coût
maîtrisé
Ds

Doc Search

Agent · recherche documentaire

Cherche dans votre base documentaire (Confluence, Notion, Google Drive). Réponses citées, pertinence optimisée, garde-fous anti-fuite de données privées.

Pertinence
élevée
Volume docs
fort
Privé
Ex

Doc Extractor

Agent · extraction structurée

PDF / image / mail → données structurées prêtes à exploiter. Factures, contrats, devis. Schémas sur mesure, validation automatique, basculement humain si résultat douteux.

Format
structuré
Précision
élevée
Volume
fort

Module · Conversation

Agents conversationnels

  • Assistant sur mesure qui répond à partir de vos documents
  • Historique conversation persistant en BDD
  • Citation des sources obligatoire
  • Escalation humaine paramétrable

Module · Génération

Génération sous contrôle

  • Drafts pour relecture humaine (jamais auto-publié)
  • Charte éditoriale intégrée dans les règles permanentes données à l'IA
  • Versioning des prompts dans Git
  • Diff visuel entre drafts successifs

Module · Extraction

Extraction & classification

  • PDF / Word / email → données dans un format prêt à intégrer dans vos outils
  • Format de sortie vérifié automatiquement à chaque extraction
  • Multi-page / lecture optique de secours sur documents scannés
  • Audit log de chaque extraction

Module · Orchestration

Automatisations métier

  • Déclencheurs sur événements (nouvel email, upload, tâche planifiée)
  • Chaîne d'étapes automatisées avec branchements conditionnels
  • Reprise automatique en cas d'erreur, rien ne se perd
  • Relance d'une chaîne depuis n'importe quelle étape

Module · Suivi en temps réel

Tableau de bord opérationnel

  • Coût des appels IA suivi en temps réel, par tâche automatisée
  • Temps de réponse mesuré à chaque étape
  • Alertes Slack si coût dépasse seuil
  • Export CSV pour analyse hors-ligne

Module · Tests & sécurité

Évaluation & garde-fous

  • Batterie de tests automatiques sur chaque tâche automatisée
  • Détection automatique si la qualité des réponses IA se dégrade
  • Seuil de certitude paramétrable avant action autonome
  • Kill switch global en cas d'incident

Sous le capot

Pas de prompt
secret.
Vous voyez tout.

Chaque appel à Claude est visible côté client. Instruction de départ, message utilisateur, réponse, raisonnement, niveau de certitude, coût. C'est versionné dans Git comme du code normal. Vous pouvez le modifier, on redéploie en 5 minutes.

claude · opus · workflows/email_triage.py 200 OK
System
# Rôle : agent de triage commercial Codemaster.
Tu es un agent de triage qui lit les emails entrants
et qui classe chaque message en "chaud", "tiede", "hors-cible".
# Garde-fous
Si confidence < 0.80 alors escalation humaine.
Ne jamais inventer un prix, un délai, une référence produit.
User
Bonjour, je suis intéressée par la création d'une boutique en ligne pour vendre des bijoux artisanaux. Budget autour de 8 000 €. Vous pouvez me rappeler cette semaine ? Cliente · 06.xx.xx.xx.xx
Claude · réponse structurée
{
  "intent": "demande_boutique_creation",
  "classification": "chaud",
  "budget_estime": 8000,
  "secteur": "bijoux_artisanaux",
  "prenom": "Cliente",
  "telephone_present": true,
  "urgence": "rappel_cette_semaine",
  "confidence": 0.94,
  "action_proposee": "creer_fiche_CRM + rappel_cal"
}
Raisonnement visible
« Le message contient un projet précis (boutique bijoux), un budget chiffré (8 k€), une demande d'action (rappel) et un canal de retour (téléphone). Pas d'ambiguïté sur l'intention. Classification "chaud" avec niveau de certitude élevé. »
Fiabilité élevée
Données envoyées courtes Résultat structuré
Budget API · janvier bien en dessous du plafond
37 % consommé · 14 j restants bien moins cher qu'un abonnement no-code

Anti-promesses

Sept refus —
noir sur blanc.

Les sept cas où l'on dit non avant même de discuter du projet. Ces clauses figurent dans nos contrats. Elles vous protègent autant qu'elles nous engagent.

Pas d'IA autonome sur sujets critiques

Juridique, médical, finance, RH. L'IA assiste, prépare, suggère. La décision finale reste humaine, tracée, signée.

Pas de collecte automatique de données contre les CGV des plateformes

On ne construit pas d'agent qui aspire des données de LinkedIn, Indeed ou Google Maps en contournant leurs conditions d'usage. Risque légal réel, pas une zone grise.

Pas de remplacement complet d'équipes humaines

L'IA augmente les humains, elle ne les remplace pas. Si l'objectif annoncé est un licenciement collectif, on n'est pas le bon prestataire.

Pas d'IA magique sans monitoring

Tests automatisés obligatoires, surveillance continue, alertes sur baisse de qualité. Une IA sans suivi se dégrade silencieusement — c'est une bombe à retardement.

Pas de prompts secrets

Tous les prompts vivent dans votre code Git. Vous les voyez, vous les modifiez, vous les versionnez. Pas de boîte noire louée à un prestataire.

Pas de no-code IA en prod

Lindy, Sweep, Cassidy, Cassidy Pro — démo séduisante, dette technique cachée. Si vous voulez posséder vos automatisations et pouvoir les modifier librement, c'est du code, point.

Pas de promesse « l'IA fait tout »

On cadre toujours le périmètre du workflow. On ne dit pas oui à « ajoute-moi une IA qui automatise tout mon SAV ». On dit « voici les 3 cas d'usage qu'on peut automatiser ce mois-ci avec un niveau de fiabilité calibré sur votre workflow ». Le reste, on garde la main humaine.

Pipeline de déploiement IA

Six étapes,
aucune surprise.

Notre déploiement standard d'un workflow IA. Six étapes datées, chacune signée par e-mail, avec un livrable testable. À chaque palier, on peut décider d'arrêter sans pénalité — l'audit et la spec restent à vous.

Audit du workflow actuel

Combien d'heures perdues, sur quoi, par qui. Volumes mesurés, sources identifiées, pain points classés par ROI potentiel. Livrable : un audit chiffré.

J0 → J+5 · audit visio + écrit

Spec du workflow IA

Étapes, garde-fous (seuil de certitude, escalade humaine), format de sortie attendu, métriques de succès. Spec signée avant qu'on touche au code.

Sem. 1 · spec PDF + cas tests

Prototype + tests de qualité

On code le prototype et on le teste sur 40 à 200 cas réels avant toute mise en production. Si les tests ne passent pas, on n'avance pas — on retravaille les instructions données à l'IA.

Sem. 2 → 3 · score suffisant ou on retravaille

Intégration Django + connecteurs

Branchements à vos outils existants (événements applicatifs, webhooks, base de données). Les tâches IA tournent en arrière-plan sans bloquer votre application. Logs structurés, traçabilité complète. L'automatisation vit dans votre application.

Sem. 3 → 4 · code + tests

Déploiement progressif

10 % du volume la première semaine, surveillance serrée, comparaison avec le traitement humain. Si les indicateurs sont au vert → 30 %, puis 100 %. Si quelque chose cloche → on revient en arrière, on corrige.

Sem. 4 → 6 · 10 % → 100 %

Monitoring continu + ajustements

Dashboard live (temps de réponse, coût, qualité des décisions, dégradations détectées). Ajustements toutes les 2-4 semaines selon ce qui remonte. Batterie de tests étendue avec les cas réels rencontrés.

90 j suivi inclus
Eval suite · email_triage.py · run #382 11 passed 1 failed 1 skipped
Classifie correctement un message « chaud »email_with_budget_and_phone.json 1.2 s
Classifie correctement un message « tiède »email_curious_no_budget.json 1.4 s
Détecte un spam évidentemail_crypto_promo.json 0.7 s
Extrait correctement un numéro de téléphone FRemail_format_phone_variants.json 0.9 s
Reconnaît un email en anglais professionnelemail_english_b2b.json — trop incertain, escalade humaine 1.5 s
Refuse d'inventer un délaiemail_asks_for_invented_quote.json 1.1 s
Cas multi-personnes (skipé — feature à venir)email_threaded_multiple.json

Pourquoi des tests automatiques de qualité ?

Sans tests, on ne sait pas si l'IA s'est dégradée. Avec cette batterie de tests, on le voit chaque matin : 4 tests qui passaient hier échouent aujourd'hui — détérioration détectée, on corrige avant que le client ne le remarque.

  • 40 à 200 cas réels annotés en J0
  • Run automatique à chaque modif de prompt
  • Alerte Slack si le score moyen baisse de plus de 5 %
  • Versioning des prompts dans votre Git, avec changelog

Ce sur quoi on s'appuie

Quatre briques.
Que des standards.

Aucune brique propriétaire. Aucune dépendance à un prestataire qui peut disparaître demain. Tout repose sur des composants matures, documentés, et qu'un autre dev sénior peut reprendre dans 5 ans sans se perdre.

A

01 · Modèles principaux

Anthropic Claude

Claude Opus (le modèle Claude le plus puissant) pour l'analyse complexe — extraction de contrats, décisions multi-critères. Claude Sonnet (le modèle équilibré) pour la majorité des tâches — triage, classification, génération. Claude Haiku (le modèle rapide et léger) pour les gros volumes à faible coût.

  • Connexion officielle Anthropic ou Bedrock UE selon vos contraintes RGPD
  • Mode sans conservation des données activable sur option
  • Économies sur les appels IA répétés — réduction significative des coûts en lecture répétée de documents
D

02 · Application + queue

Django + Celery

Django pour l'application et l'administration, Celery + Redis pour les tâches IA en arrière-plan. Chaque tâche automatisée se relance en cas d'erreur, rien ne se perd. Pas de dépendance à un outil tiers d'orchestration.

  • Chaque appel IA enregistré en base — qui, quoi, quand, résultat
  • Événements applicatifs comme déclencheurs de tâches automatisées
  • Interface d'administration pour relancer une tâche manuellement
P

03 · Base de données + recherche dans vos documents

PostgreSQL + pgvector

Une seule base de données pour tout (application + recherche dans vos documents). Vos documents sont transformés en données comprises par l'IA, stockés dans cette même base — sans outil tiers à louer mensuellement.

  • Méthode d'indexation choisie selon vos contraintes RGPD
  • Résultats re-classés par pertinence réelle — l'IA cite vos vraies infos
  • Backup quotidien chiffré · rétention 30 j
F

04 · Fallback & redondance

Fallbacks multi-provider

Si la connexion Anthropic est indisponible (rare), bascule automatique sur OpenAI ou un modèle hébergé en interne selon la tâche. Pas de dépendance unique à un seul fournisseur — la continuité de service prime.

  • Modèles alternatifs hébergés sur Cloudflare pour les cas d'urgence
  • OpenAI en secours d'urgence (avec accord client)
  • Bascule automatique si les temps de réponse se dégradent

Cas anonymisés

Trois workflows IA
en production.

Les trois clients qui nous ont autorisé à parler du contexte, pas du nom. Démos sous NDA possibles en visio — on montre l'écran, on lit les logs, on répond aux questions techniques.

Cabinet d'assurance · IARD

Classification automatique des sinistres entrants

Plusieurs centaines de sinistres par jour reçus par email + courrier scanné. L'agent extrait les infos clés (police, sinistré, type, montant estimé), classe en 5 catégories, et crée une fiche dans le SI métier. Garde-fou humain dès que la situation est ambiguë. Le gestionnaire ouvre directement une fiche pré-remplie au lieu de saisir.

Précision
élevée
Temps saisie
réduit
Coût
maîtrisé

Marketplace B2B · 120 vendeurs

Auto-matching producteurs & laveurs

Quand un producteur dépose une demande de lavage de bouteilles, l'agent IA lit le besoin (volume, fréquence, géolocalisation, contraintes sanitaires) et propose les 3 laveurs les plus pertinents. Avec un score d'adéquation explicable. Sortie validée par un opérateur avant envoi.

Pertinence
élevée
Réponse
rapide
Taux de mise en relation
en hausse

Atelier de céramique · D2C

Chatbot SAV sur catalogue complet

Le bot répond aux questions clients sur l'entretien, la cuisson, les dimensions, les délais de fabrication. Branché sur le catalogue complet et l'historique éditorial. Cite ses sources, propose l'humain en moins de 2 messages s'il bloque. Décharge l'atelier de la majorité des questions répétitives.

Auto-résolution
majoritaire
Satisfaction
très bonne
Sources
citées

« Trois clients. Trois métiers très différents. Une seule constante : l'humain reste aux commandes des décisions qui comptent. »

— Démo écran partagé possible · sous NDA

Suivi en temps réel

Le dashboard
que vous regardez
tous les matins.

Vue d'ensemble en temps réel de toutes vos tâches automatisées. Coût des appels IA, temps de réponse, qualité, taux de transmission à un humain. Si quelque chose se dégrade, vous le voyez avant que le client ne le remarque.

Volume IA en hausse

Élevé

opérations traitées chaque mois

Coût API optimisé

Maîtrisé

quelques centimes par traitement

Temps de réponse stable

Rapide

temps de réponse maîtrisé

Succès workflow fiable

Élevé

objectif de fiabilité tenu

Escalades humaines maîtrisées

Rares

seuils bien calibrés

— Flow de données · vue producer / consumer

Sources

Email IMAP Webhooks externes Uploads PDF Chat widget

Pipeline

Claude Sonnet Recherche dans vos docs Validation de la sortie Tests automatiques

Destinations

CRM interne Notif Slack Email Sendgrid Audit log

IA la + sollicitée · 30j workflows courants

majoritaire

raisonnement complexe · tâches légères · selon besoin

— Aperçu interface · données fictives

Workflow le + appelé · 30j email_triage.py

workflow le plus appelé

extraction_facture · forte volumétrie · chatbot_sav · volume soutenu

Décrire votre workflow

Une idée
de workflow
à automatiser ?

On en parle : 45 minutes en visio pour comprendre votre tâche manuelle, identifier ce qui est automatisable et ce qui doit le rester, et estimer un PoC en moins de 6 semaines. Sans engagement.

  • Visio 45 min · offerte, sans engagement
  • Cadrage écrit livré sous 48 h après l'appel
  • NDA signé en J0 si vos workflows sont sensibles
  • Un seul interlocuteur — Dylan, du cadrage au monitoring
Démarrer une conversation

Lancer un PoC Étape finale

Lancer un
proof-of-concept.
Offert.

Contenu du PoC offert

Audit du workflow actuel

Volumes mesurés · pain points classés · ROI estimé

Offert

Spec écrite du workflow IA

Étapes · garde-fous · schéma sortie · métriques succès

Offert

Prototype testable sur vos données

Tests automatiques ≥ 40 cas réels · démo écran partagé

Offert

Devis ferme de mise en prod

Prix transparent · délai estimé · pas d'engagement

Offert
À payer aujourd'hui 0,00 €
NDA possible Sans engagement Réponse < 24 h Atelier français

Aucun envoi de vos données à un modèle d'IA tiers sans accord écrit · Vous gardez 100 % du code et des instructions données à l'IA · Architecture reproductible par tout développeur expérimenté