Tout le parcours d’Agentique World construit des agents avec LangGraph (l’orchestration) et LangFuse (l’observabilité). Reste la question qui décide d’un passage en production : sur quelle infrastructure ? Notre réponse de référence est AWS. Encore faut-il s’y retrouver — la stack IA AWS 2026 est vaste. Ce panorama est la carte : à chaque brique agentique, le service AWS qui la porte.

Les deux portes d’entrée : Bedrock et SageMaker

AWS propose deux niveaux d’accès aux modèles, et le choix structure tout le reste.

  • Amazon Bedrock — l’API managée de modèles de fondation. On consomme des modèles (Anthropic Claude, Amazon Nova, Meta Llama, Mistral, Cohere…) via une API unique, sans gérer d’infrastructure. C’est la porte par défaut pour l’agentique.
  • Amazon SageMaker AI — la plateforme pour héberger ses propres modèles : modèles open-weights, fine-tunés, embeddings ou rerankers sur-mesure, sur des endpoints que vous contrôlez. La porte pour la personnalisation et le contrôle.

La carte : un besoin agentique = un service AWS

Reprenons les briques d’un agent (vues en initiation) et la chaîne de production (vue en deep-dive), et plaçons chaque besoin sur la stack.

Besoin agentiqueService AWS 2026Deep-dive lié
Modèle de raisonnementBedrock (Claude, Nova…) / SageMakerBedrock LLM
Tool callingBedrock Converse API (toolConfig)Tool calling
Récupération (RAG)OpenSearch Serverless, Kendra, S3 Vectors, Aurora pgvectorRAG hybride
RAG managéBedrock Knowledge BasesKnowledge Bases
Mémoire long-termeAgentCore Memory, DynamoDB, OpenSearchMémoire & Store
Persistance / checkpointingDynamoDB (checkpointer), Bedrock SessionsCheckpointing
OrchestrationLangGraph (sur AgentCore Runtime), Step FunctionsOrchestration
Garde-fous / sécuritéBedrock Guardrails, IAM, PrivateLink, KMSSécurité
ÉvaluationBedrock Evaluations + LangFuseÉvaluation
ObservabilitéAgentCore Observability, CloudWatch + LangFuseStreaming
Exécution d’outils isoléeAgentCore Code Interpreter / BrowserAgent de code
Hébergement de l’agentAgentCore Runtime, Lambda, ECS/EKSArchi production

Amazon Bedrock, le cœur

Bedrock concentre l’essentiel de ce dont un agent a besoin, sous une API unique :

Fig.01 · Surface de Bedrock
LLM Converse API modèles + tool use
RAG Knowledge Bases RAG managé
sécurité Guardrails filtres & PII
qualité Evaluations LLM-juge managé
Bedrock n'est pas qu'un accès aux modèles : c'est un ensemble de briques managées qui couvrent récupération, garde-fous, évaluation et orchestration.
  • Converse API — l’API unifiée d’inférence, avec tool use et streaming. C’est elle qu’on branche à LangGraph via langchain-aws.
  • Knowledge Bases — un RAG managé de bout en bout (ingestion, chunking, index, récupération), adossé à OpenSearch, Aurora ou S3 Vectors.
  • Guardrails — filtres de contenu, déni de sujets, caviardage de PII, vérification d’ancrage — applicables à n’importe quel modèle.
  • Evaluations, Prompt Management, Flows, Rerank, Data Automation complètent l’ensemble.

Les modèles 2026 : Claude et Nova en tête

Sur Bedrock, deux familles dominent l’usage agentique :

  • Anthropic Claude — la référence pour le raisonnement, le tool use fiable et les agents exigeants. Notre choix par défaut pour la décision.
  • Amazon Nova (Micro, Lite, Pro, Premier) — la famille maison d’AWS, optimisée coût/latence. Excellente pour le routage, la classification et les tâches à fort volume — l’occasion d’appliquer le routage de modèles.

Bedrock AgentCore : le runtime agentique 2026

La grande nouveauté côté agents est Bedrock AgentCore : un ensemble de services managés pour exécuter des agents en production, agnostique du framework — vos graphes LangGraph y tournent tels quels. Ses modules :

  • Runtime — exécution serverless et isolée des agents, sessions longues.
  • Memory — mémoire court et long terme managée.
  • Gateway — exposition d’API et de services internes comme outils.
  • Identity — authentification et délégation d’accès pour les actions de l’agent.
  • Code Interpreter & Browser — exécution de code et navigation isolées.
  • Observability — traces et métriques (complémentaires de LangFuse).

SageMaker : quand on veut son propre modèle

SageMaker AI entre en jeu dès que Bedrock ne suffit plus :

  • JumpStart — déployer en un clic des modèles open-weights (Llama, Mistral, embeddings, rerankers).
  • Endpoints — héberger un modèle fine-tuné derrière une API à vous, avec contrôle de la latence et du coût à l’échelle.
  • Fine-tuning / HyperPod — adapter ou entraîner des modèles sur vos données.

Un endpoint SageMaker s’intègre à LangGraph comme n’importe quel modèle ou retriever. On y revient dans le deep-dive SageMaker.

Récupération : bien plus que pgvector

AWS offre un éventail de moteurs de récupération, chacun avec sa zone de pertinence :

  • OpenSearch Serverless — vecteurs et mots-clés : le socle du RAG hybride.
  • Amazon Kendra — recherche d’entreprise sémantique, connecteurs prêts à l’emploi.
  • S3 Vectors — stockage vectoriel natif dans S3, économique à grande échelle.
  • Aurora PostgreSQL (pgvector) — le pgvector que vous connaissez, managé.
  • Amazon Neptune — graphe de connaissances pour le GraphRAG.

Ce qu’il faut retenir

  • Sur AWS, la porte par défaut est Bedrock (managé) ; SageMaker prend le relais pour les modèles sur-mesure.
  • Chaque brique agentique a son service : Converse API (LLM + outils), Knowledge Bases (RAG), OpenSearch (hybride), Guardrails (sécurité), Evaluations (qualité).
  • AgentCore est le runtime agentique 2026 : il héberge vos graphes LangGraph, il ne les remplace pas.
  • Claude pour le raisonnement, Nova pour le volume — le routage de modèles est natif.
  • LangGraph et LangFuse restent au centre : AWS fournit l’infrastructure, pas la logique.

La carte est posée. Plongeons dans le cœur : faire de Bedrock le moteur LLM de vos agents LangGraph.

#aws#bedrock#sagemaker#agentcore#panorama