Espace avancé · Deep-dive

L'ingénierie agentique en production

Pour celles et ceux qui ont déjà écrit leur premier agent. On démonte les patterns avancés : orchestration multi-agents, persistance, reprise sur erreur, évaluation systématique et observabilité fine.

Expert

GraphRAG sur Amazon Neptune : récupérer par les relations

Le RAG vectoriel échoue sur les questions multi-sauts et relationnelles. Le GraphRAG récupère en traversant un graphe de connaissances. Construire ce graphe (extraction d'entités et de relations), l'héberger sur Amazon Neptune, et brancher la récupération par traversal à un agent LangGraph — avec Bedrock.

#aws#graphrag#neptune 30 min
Avancé

Bedrock Guardrails en profondeur : filtres, PII, ancrage et déni de sujets

Le garde-fou managé d'AWS, décortiqué : filtres de contenu, déni de sujets, filtres de mots, protection des informations sensibles (PII), et vérification d'ancrage contextuel contre l'hallucination. L'API ApplyGuardrail autonome, l'attachement à l'inférence, et l'intégration comme nœud de garde dans un graphe LangGraph.

#aws#bedrock#guardrails 28 min
Expert

Architecture de production agentique sur AWS : l'assemblage de référence

Tout assembler en une architecture qui tient la charge : ingress, compute (AgentCore Runtime, Lambda, ECS/EKS), agent LangGraph, Bedrock (modèles, Guardrails, Knowledge Bases), récupération OpenSearch, checkpointing DynamoDB, observabilité LangFuse + CloudWatch, et la sécurité réseau/IAM. Le plan de référence DEEP-5.

#aws#architecture#production 32 min
Expert

SageMaker AI pour l'agentique : vos propres modèles dans la boucle

Quand Bedrock ne suffit plus : héberger un modèle sur-mesure, un embedding ou un reranker spécialisé sur Amazon SageMaker AI. JumpStart, endpoints temps réel, fine-tuning, et l'intégration d'un endpoint SageMaker comme modèle ou retriever d'un agent LangGraph.

#aws#sagemaker#fine-tuning 30 min
Avancé

Bedrock Knowledge Bases & Agents face à LangGraph : managé ou code-first ?

AWS propose du RAG et des agents managés : Knowledge Bases (ingestion, index, récupération clés en main) et Bedrock Agents (action groups, orchestration managée). Quand les choisir, quand préférer LangGraph, et comment composer les deux — y compris héberger un graphe LangGraph sur AgentCore Runtime.

#aws#bedrock#knowledge-bases 28 min
Avancé

RAG hybride sur AWS : dense, sparse, fusion et reranking

La récupération dense (vecteurs) seule a un angle mort : les termes exacts. La récupération hybride combine kNN sémantique et BM25 lexical, fusionnés par RRF puis reclassés. Mise en œuvre sur OpenSearch Serverless et Bedrock, branchée à un agent LangGraph.

#aws#rag#opensearch 32 min
Avancé

Amazon Bedrock comme moteur LLM de vos agents LangGraph

Brancher Bedrock sur LangGraph, en profondeur : la Converse API et son tool use, ChatBedrockConverse, le streaming, le choix et le routage des modèles (Claude, Nova), l'inférence cross-region, et l'attachement de Guardrails. Du code boto3 et langchain-aws.

#aws#bedrock#langgraph 30 min
Avancé

La stack IA AWS 2026 pour l'agentique : le panorama

AWS est notre stack de référence. Ce panorama relie chaque besoin agentique — modèle, mémoire, récupération, outils, orchestration, garde-fous, observabilité, déploiement — au bon service AWS 2026 : Bedrock, AgentCore, Knowledge Bases, OpenSearch, SageMaker, Guardrails. La carte avant le territoire.

#aws#bedrock#sagemaker 26 min
Avancé

Gestion du contexte & maîtrise des coûts

L'historique d'un agent grossit à chaque tour — et avec lui le coût, la latence et la confusion du modèle. Les stratégies de gestion de la fenêtre de contexte (troncature, résumé, filtrage) et les leviers de coût (routage de modèles, cache, budgets) mesurés avec LangFuse.

#langgraph#contexte#couts 28 min
Expert

Sécurité & garde-fous : défendre un agent en production

Un agent qui agit sur le monde est une surface d'attaque. Modèle de menace (injection de prompt directe et indirecte, abus d'outils, exfiltration), et défense en profondeur : garde-fous d'entrée et de sortie, moindre privilège, human-in-the-loop, sandboxing et bornage.

#securite#garde-fous#prompt-injection 30 min
Avancé

Évaluer un agent avec LangFuse : datasets, LLM-juge et non-régression

Sortir du « ça a l'air de marcher » : mesurer la qualité d'un agent de façon systématique. Scores humains, heuristiques et LLM-as-a-judge, datasets de référence, expériences comparatives et tests de non-régression en intégration continue.

#langfuse#evaluation#llm-judge 30 min
Avancé

Streaming LangGraph : une UX d'agent en temps réel

Un agent qui réfléchit dix secondes en silence est inutilisable. Maîtriser les modes de streaming de LangGraph — états, mises à jour, tokens, événements personnalisés — pour restituer le travail de l'agent au fil de l'eau, jusque dans l'interface.

#langgraph#streaming#ux 28 min
Avancé

Mémoire long-terme : le Store, au-delà du thread

Donner à un agent une mémoire qui traverse les conversations : le Store de LangGraph, ses namespaces, la recherche sémantique, l'accès depuis les nœuds et les outils, et les stratégies d'écriture (hot path vs arrière-plan).

#langgraph#memoire#store 30 min
Avancé

Patterns d'orchestration LangGraph : du chaînage au multi-agents

Le catalogue des architectures, avec code : prompt chaining, routing, parallélisation et map-reduce (Send), orchestrateur-ouvriers, évaluateur-optimiseur, sous-graphes et systèmes multi-agents en superviseur. Et le primitive qui les unifie : Command.

#langgraph#orchestration#multi-agent 36 min
Avancé

Tool calling avancé : des outils robustes pour la production

Le tool calling, jusqu'au fond : schémas Pydantic riches, injection d'état et de config cachée au modèle, ToolNode en profondeur, mise à jour du graphe depuis un outil via Command, artefacts, gestion fine des erreurs et contraintes d'appel.

#langgraph#tool-calling#pydantic 32 min
Avancé

Checkpointing & human-in-the-loop : un agent durable et interruptible

La persistance n'est pas qu'une commodité : c'est ce qui transforme un agent jetable en système fiable, capable de reprendre, de revenir en arrière et de demander une validation humaine avant d'agir.

#langgraph#checkpointer#human-in-the-loop 24 min