Tout le parcours d’Agentique World construit des agents avec LangGraph (l’orchestration) et LangFuse (l’observabilité). Reste la question qui décide d’un passage en production : sur quelle infrastructure ? Notre réponse de référence est AWS. Encore faut-il s’y retrouver — la stack IA AWS 2026 est vaste. Ce panorama est la carte : à chaque brique agentique, le service AWS qui la porte.
Les deux portes d’entrée : Bedrock et SageMaker
AWS propose deux niveaux d’accès aux modèles, et le choix structure tout le reste.
- Amazon Bedrock — l’API managée de modèles de fondation. On consomme des modèles (Anthropic Claude, Amazon Nova, Meta Llama, Mistral, Cohere…) via une API unique, sans gérer d’infrastructure. C’est la porte par défaut pour l’agentique.
- Amazon SageMaker AI — la plateforme pour héberger ses propres modèles : modèles open-weights, fine-tunés, embeddings ou rerankers sur-mesure, sur des endpoints que vous contrôlez. La porte pour la personnalisation et le contrôle.
La carte : un besoin agentique = un service AWS
Reprenons les briques d’un agent (vues en initiation) et la chaîne de production (vue en deep-dive), et plaçons chaque besoin sur la stack.
| Besoin agentique | Service AWS 2026 | Deep-dive lié |
|---|---|---|
| Modèle de raisonnement | Bedrock (Claude, Nova…) / SageMaker | Bedrock LLM |
| Tool calling | Bedrock Converse API (toolConfig) | Tool calling |
| Récupération (RAG) | OpenSearch Serverless, Kendra, S3 Vectors, Aurora pgvector | RAG hybride |
| RAG managé | Bedrock Knowledge Bases | Knowledge Bases |
| Mémoire long-terme | AgentCore Memory, DynamoDB, OpenSearch | Mémoire & Store |
| Persistance / checkpointing | DynamoDB (checkpointer), Bedrock Sessions | Checkpointing |
| Orchestration | LangGraph (sur AgentCore Runtime), Step Functions | Orchestration |
| Garde-fous / sécurité | Bedrock Guardrails, IAM, PrivateLink, KMS | Sécurité |
| Évaluation | Bedrock Evaluations + LangFuse | Évaluation |
| Observabilité | AgentCore Observability, CloudWatch + LangFuse | Streaming |
| Exécution d’outils isolée | AgentCore Code Interpreter / Browser | Agent de code |
| Hébergement de l’agent | AgentCore Runtime, Lambda, ECS/EKS | Archi production |
Amazon Bedrock, le cœur
Bedrock concentre l’essentiel de ce dont un agent a besoin, sous une API unique :
- Converse API — l’API unifiée d’inférence, avec tool use et streaming. C’est
elle qu’on branche à LangGraph via
langchain-aws. - Knowledge Bases — un RAG managé de bout en bout (ingestion, chunking, index, récupération), adossé à OpenSearch, Aurora ou S3 Vectors.
- Guardrails — filtres de contenu, déni de sujets, caviardage de PII, vérification d’ancrage — applicables à n’importe quel modèle.
- Evaluations, Prompt Management, Flows, Rerank, Data Automation complètent l’ensemble.
Les modèles 2026 : Claude et Nova en tête
Sur Bedrock, deux familles dominent l’usage agentique :
- Anthropic Claude — la référence pour le raisonnement, le tool use fiable et les agents exigeants. Notre choix par défaut pour la décision.
- Amazon Nova (Micro, Lite, Pro, Premier) — la famille maison d’AWS, optimisée coût/latence. Excellente pour le routage, la classification et les tâches à fort volume — l’occasion d’appliquer le routage de modèles.
Bedrock AgentCore : le runtime agentique 2026
La grande nouveauté côté agents est Bedrock AgentCore : un ensemble de services managés pour exécuter des agents en production, agnostique du framework — vos graphes LangGraph y tournent tels quels. Ses modules :
- Runtime — exécution serverless et isolée des agents, sessions longues.
- Memory — mémoire court et long terme managée.
- Gateway — exposition d’API et de services internes comme outils.
- Identity — authentification et délégation d’accès pour les actions de l’agent.
- Code Interpreter & Browser — exécution de code et navigation isolées.
- Observability — traces et métriques (complémentaires de LangFuse).
SageMaker : quand on veut son propre modèle
SageMaker AI entre en jeu dès que Bedrock ne suffit plus :
- JumpStart — déployer en un clic des modèles open-weights (Llama, Mistral, embeddings, rerankers).
- Endpoints — héberger un modèle fine-tuné derrière une API à vous, avec contrôle de la latence et du coût à l’échelle.
- Fine-tuning / HyperPod — adapter ou entraîner des modèles sur vos données.
Un endpoint SageMaker s’intègre à LangGraph comme n’importe quel modèle ou retriever. On y revient dans le deep-dive SageMaker.
Récupération : bien plus que pgvector
AWS offre un éventail de moteurs de récupération, chacun avec sa zone de pertinence :
- OpenSearch Serverless — vecteurs et mots-clés : le socle du RAG hybride.
- Amazon Kendra — recherche d’entreprise sémantique, connecteurs prêts à l’emploi.
- S3 Vectors — stockage vectoriel natif dans S3, économique à grande échelle.
- Aurora PostgreSQL (pgvector) — le pgvector que vous connaissez, managé.
- Amazon Neptune — graphe de connaissances pour le GraphRAG.
Ce qu’il faut retenir
- Sur AWS, la porte par défaut est Bedrock (managé) ; SageMaker prend le relais pour les modèles sur-mesure.
- Chaque brique agentique a son service : Converse API (LLM + outils), Knowledge Bases (RAG), OpenSearch (hybride), Guardrails (sécurité), Evaluations (qualité).
- AgentCore est le runtime agentique 2026 : il héberge vos graphes LangGraph, il ne les remplace pas.
- Claude pour le raisonnement, Nova pour le volume — le routage de modèles est natif.
- LangGraph et LangFuse restent au centre : AWS fournit l’infrastructure, pas la logique.
La carte est posée. Plongeons dans le cœur : faire de Bedrock le moteur LLM de vos agents LangGraph.