La stack IA AWS 2026 pour l'agentique : le panorama

Tout le parcours d’Agentique World construit des agents avec LangGraph (l’orchestration) et LangFuse (l’observabilité). Reste la question qui décide d’un passage en production : sur quelle infrastructure ? Notre réponse de référence est AWS. Encore faut-il s’y retrouver — la stack IA AWS 2026 est vaste. Ce panorama est la carte : à chaque brique agentique, le service AWS qui la porte.

Les deux portes d’entrée : Bedrock et SageMaker

AWS propose deux niveaux d’accès aux modèles, et le choix structure tout le reste.

Amazon Bedrock — l’API managée de modèles de fondation. On consomme des modèles (Anthropic Claude, Amazon Nova, Meta Llama, Mistral, Cohere…) via une API unique, sans gérer d’infrastructure. C’est la porte par défaut pour l’agentique.
Amazon SageMaker AI — la plateforme pour héberger ses propres modèles : modèles open-weights, fine-tunés, embeddings ou rerankers sur-mesure, sur des endpoints que vous contrôlez. La porte pour la personnalisation et le contrôle.

La carte : un besoin agentique = un service AWS

Reprenons les briques d’un agent (vues en initiation) et la chaîne de production (vue en deep-dive), et plaçons chaque besoin sur la stack.

Besoin agentique	Service AWS 2026	Deep-dive lié
Modèle de raisonnement	Bedrock (Claude, Nova…) / SageMaker	Bedrock LLM
Tool calling	Bedrock Converse API (`toolConfig`)	Tool calling
Récupération (RAG)	OpenSearch Serverless, Kendra, S3 Vectors, Aurora pgvector	RAG hybride
RAG managé	Bedrock Knowledge Bases	Knowledge Bases
Mémoire long-terme	AgentCore Memory, DynamoDB, OpenSearch	Mémoire & Store
Persistance / checkpointing	DynamoDB (checkpointer), Bedrock Sessions	Checkpointing
Orchestration	LangGraph (sur AgentCore Runtime), Step Functions	Orchestration
Garde-fous / sécurité	Bedrock Guardrails, IAM, PrivateLink, KMS	Sécurité
Évaluation	Bedrock Evaluations + LangFuse	Évaluation
Observabilité	AgentCore Observability, CloudWatch + LangFuse	Streaming
Exécution d’outils isolée	AgentCore Code Interpreter / Browser	Agent de code
Hébergement de l’agent	AgentCore Runtime, Lambda, ECS/EKS	Archi production

Amazon Bedrock, le cœur

Bedrock concentre l’essentiel de ce dont un agent a besoin, sous une API unique :

Fig.01 · Surface de Bedrock

LLM Converse API modèles + tool use

RAG Knowledge Bases RAG managé

sécurité Guardrails filtres & PII

qualité Evaluations LLM-juge managé

Bedrock n'est pas qu'un accès aux modèles : c'est un ensemble de briques managées qui couvrent récupération, garde-fous, évaluation et orchestration.

Converse API — l’API unifiée d’inférence, avec tool use et streaming. C’est elle qu’on branche à LangGraph via langchain-aws.
Knowledge Bases — un RAG managé de bout en bout (ingestion, chunking, index, récupération), adossé à OpenSearch, Aurora ou S3 Vectors.
Guardrails — filtres de contenu, déni de sujets, caviardage de PII, vérification d’ancrage — applicables à n’importe quel modèle.
Evaluations, Prompt Management, Flows, Rerank, Data Automation complètent l’ensemble.

Les modèles 2026 : Claude et Nova en tête

Sur Bedrock, deux familles dominent l’usage agentique :

Anthropic Claude — la référence pour le raisonnement, le tool use fiable et les agents exigeants. Notre choix par défaut pour la décision.
Amazon Nova (Micro, Lite, Pro, Premier) — la famille maison d’AWS, optimisée coût/latence. Excellente pour le routage, la classification et les tâches à fort volume — l’occasion d’appliquer le routage de modèles.

Bedrock AgentCore : le runtime agentique 2026

La grande nouveauté côté agents est Bedrock AgentCore : un ensemble de services managés pour exécuter des agents en production, agnostique du framework — vos graphes LangGraph y tournent tels quels. Ses modules :

Runtime — exécution serverless et isolée des agents, sessions longues.
Memory — mémoire court et long terme managée.
Gateway — exposition d’API et de services internes comme outils.
Identity — authentification et délégation d’accès pour les actions de l’agent.
Code Interpreter & Browser — exécution de code et navigation isolées.
Observability — traces et métriques (complémentaires de LangFuse).

SageMaker : quand on veut son propre modèle

SageMaker AI entre en jeu dès que Bedrock ne suffit plus :

JumpStart — déployer en un clic des modèles open-weights (Llama, Mistral, embeddings, rerankers).
Endpoints — héberger un modèle fine-tuné derrière une API à vous, avec contrôle de la latence et du coût à l’échelle.
Fine-tuning / HyperPod — adapter ou entraîner des modèles sur vos données.

Un endpoint SageMaker s’intègre à LangGraph comme n’importe quel modèle ou retriever. On y revient dans le deep-dive SageMaker.

Récupération : bien plus que pgvector

AWS offre un éventail de moteurs de récupération, chacun avec sa zone de pertinence :

OpenSearch Serverless — vecteurs et mots-clés : le socle du RAG hybride.
Amazon Kendra — recherche d’entreprise sémantique, connecteurs prêts à l’emploi.
S3 Vectors — stockage vectoriel natif dans S3, économique à grande échelle.
Aurora PostgreSQL (pgvector) — le pgvector que vous connaissez, managé.
Amazon Neptune — graphe de connaissances pour le GraphRAG.

Ce qu’il faut retenir

Sur AWS, la porte par défaut est Bedrock (managé) ; SageMaker prend le relais pour les modèles sur-mesure.
Chaque brique agentique a son service : Converse API (LLM + outils), Knowledge Bases (RAG), OpenSearch (hybride), Guardrails (sécurité), Evaluations (qualité).
AgentCore est le runtime agentique 2026 : il héberge vos graphes LangGraph, il ne les remplace pas.
Claude pour le raisonnement, Nova pour le volume — le routage de modèles est natif.
LangGraph et LangFuse restent au centre : AWS fournit l’infrastructure, pas la logique.

La carte est posée. Plongeons dans le cœur : faire de Bedrock le moteur LLM de vos agents LangGraph.