Espace avancé · Deep-dive
L'ingénierie agentique en production
Pour celles et ceux qui ont déjà écrit leur premier agent. On démonte les patterns avancés : orchestration multi-agents, persistance, reprise sur erreur, évaluation systématique et observabilité fine.
GraphRAG sur Amazon Neptune : récupérer par les relations
Le RAG vectoriel échoue sur les questions multi-sauts et relationnelles. Le GraphRAG récupère en traversant un graphe de connaissances. Construire ce graphe (extraction d'entités et de relations), l'héberger sur Amazon Neptune, et brancher la récupération par traversal à un agent LangGraph — avec Bedrock.
Bedrock Guardrails en profondeur : filtres, PII, ancrage et déni de sujets
Le garde-fou managé d'AWS, décortiqué : filtres de contenu, déni de sujets, filtres de mots, protection des informations sensibles (PII), et vérification d'ancrage contextuel contre l'hallucination. L'API ApplyGuardrail autonome, l'attachement à l'inférence, et l'intégration comme nœud de garde dans un graphe LangGraph.
Architecture de production agentique sur AWS : l'assemblage de référence
Tout assembler en une architecture qui tient la charge : ingress, compute (AgentCore Runtime, Lambda, ECS/EKS), agent LangGraph, Bedrock (modèles, Guardrails, Knowledge Bases), récupération OpenSearch, checkpointing DynamoDB, observabilité LangFuse + CloudWatch, et la sécurité réseau/IAM. Le plan de référence DEEP-5.
SageMaker AI pour l'agentique : vos propres modèles dans la boucle
Quand Bedrock ne suffit plus : héberger un modèle sur-mesure, un embedding ou un reranker spécialisé sur Amazon SageMaker AI. JumpStart, endpoints temps réel, fine-tuning, et l'intégration d'un endpoint SageMaker comme modèle ou retriever d'un agent LangGraph.
Bedrock Knowledge Bases & Agents face à LangGraph : managé ou code-first ?
AWS propose du RAG et des agents managés : Knowledge Bases (ingestion, index, récupération clés en main) et Bedrock Agents (action groups, orchestration managée). Quand les choisir, quand préférer LangGraph, et comment composer les deux — y compris héberger un graphe LangGraph sur AgentCore Runtime.
RAG hybride sur AWS : dense, sparse, fusion et reranking
La récupération dense (vecteurs) seule a un angle mort : les termes exacts. La récupération hybride combine kNN sémantique et BM25 lexical, fusionnés par RRF puis reclassés. Mise en œuvre sur OpenSearch Serverless et Bedrock, branchée à un agent LangGraph.
Amazon Bedrock comme moteur LLM de vos agents LangGraph
Brancher Bedrock sur LangGraph, en profondeur : la Converse API et son tool use, ChatBedrockConverse, le streaming, le choix et le routage des modèles (Claude, Nova), l'inférence cross-region, et l'attachement de Guardrails. Du code boto3 et langchain-aws.
La stack IA AWS 2026 pour l'agentique : le panorama
AWS est notre stack de référence. Ce panorama relie chaque besoin agentique — modèle, mémoire, récupération, outils, orchestration, garde-fous, observabilité, déploiement — au bon service AWS 2026 : Bedrock, AgentCore, Knowledge Bases, OpenSearch, SageMaker, Guardrails. La carte avant le territoire.
Gestion du contexte & maîtrise des coûts
L'historique d'un agent grossit à chaque tour — et avec lui le coût, la latence et la confusion du modèle. Les stratégies de gestion de la fenêtre de contexte (troncature, résumé, filtrage) et les leviers de coût (routage de modèles, cache, budgets) mesurés avec LangFuse.
Sécurité & garde-fous : défendre un agent en production
Un agent qui agit sur le monde est une surface d'attaque. Modèle de menace (injection de prompt directe et indirecte, abus d'outils, exfiltration), et défense en profondeur : garde-fous d'entrée et de sortie, moindre privilège, human-in-the-loop, sandboxing et bornage.
Évaluer un agent avec LangFuse : datasets, LLM-juge et non-régression
Sortir du « ça a l'air de marcher » : mesurer la qualité d'un agent de façon systématique. Scores humains, heuristiques et LLM-as-a-judge, datasets de référence, expériences comparatives et tests de non-régression en intégration continue.
Streaming LangGraph : une UX d'agent en temps réel
Un agent qui réfléchit dix secondes en silence est inutilisable. Maîtriser les modes de streaming de LangGraph — états, mises à jour, tokens, événements personnalisés — pour restituer le travail de l'agent au fil de l'eau, jusque dans l'interface.
Mémoire long-terme : le Store, au-delà du thread
Donner à un agent une mémoire qui traverse les conversations : le Store de LangGraph, ses namespaces, la recherche sémantique, l'accès depuis les nœuds et les outils, et les stratégies d'écriture (hot path vs arrière-plan).
Patterns d'orchestration LangGraph : du chaînage au multi-agents
Le catalogue des architectures, avec code : prompt chaining, routing, parallélisation et map-reduce (Send), orchestrateur-ouvriers, évaluateur-optimiseur, sous-graphes et systèmes multi-agents en superviseur. Et le primitive qui les unifie : Command.
Tool calling avancé : des outils robustes pour la production
Le tool calling, jusqu'au fond : schémas Pydantic riches, injection d'état et de config cachée au modèle, ToolNode en profondeur, mise à jour du graphe depuis un outil via Command, artefacts, gestion fine des erreurs et contraintes d'appel.
Checkpointing & human-in-the-loop : un agent durable et interruptible
La persistance n'est pas qu'une commodité : c'est ce qui transforme un agent jetable en système fiable, capable de reprendre, de revenir en arrière et de demander une validation humaine avant d'agir.