Alors comme ça vous voulez devenir des cracks en conception IA, être la personne qui connait toutes les architectures et sait lesquelles utiliser dans quels cas ? Bon, alors il va falloir commencer par le commencement, les patterns de conception agentique. Qu'est-ce que c'est exactement ? On vous dit tout !
On connait déjà bien les design patterns…
Face à un problème de conception qui revient, on évite de réinventer la roue, alors on a créé les design patterns, ces schémas d'architecture qui sont désormais bien connus des ingénieurs logiciel. Plusieurs sont apparus et au fil des années ils ont été éprouvés, ils ont évolué, et des bonnes pratiques ont émergé. On a commencé à entendre parler d'architecture hexagonale, de clean code, de principes SOLID, de TDD, etc...
À l'ère de l'IA Générative, les même pratiques vont arriver afin de répondre à des problématiques diverses : Comment choisir les skills, les tools, les agents, les modèles dans mon outil dopé à l'IA ? Comment correctement faire collaborer les agents entre eux ? Comment optimiser les coûts ? Comment rendre le travail des agents efficaces en "équipe" ? etc...
Et si on tentait une définition ?
Un pattern de conception agentique est une solution réutilisable et indépendante de l'implémentation à un problème récurrent de conception d'agents IA. Il décrit comment organiser le raisonnement, les actions et la mémoire d'un agent, sans imposer de framework ni de langage particulier.
Le comportement de base d'un agent : la boucle
Le pattern qui constitue le fondement des agents : ReAct (Reasoning + Acting). L'agent réfléchit, agit, observe, réfléchit, agit, observe,... jusqu'à effectuer une observation satisfaisante et fournir sa réponse finale.

Quelques mécanismes largement utilisées
La liste suivante n'est pas exhaustive, mais donne un premier aperçu de quelques mécanismes très connus.
- ReAct : C'est celui que nous avons cité au-dessus. Il constitue la base de raisonnement d'un agent.
- Chain-of-Thought (CoT) : On va forcer le modèle à décrire sa pensée étape par étape.
Exemple de prompt : Un champs contient 200 arbres. 20% sont malades et ne produisent rien d'exploitable. Parmi ceux qui sont en bonne santé, 25% ne produisent pas de fruits. Combien d'arbres en bonne santé produisent des fruits ? Réfléchis étape par étape - Orchestrator–Workers : L'idée est de composer les agents. Un cerveau central (l'orchestrateur) répartit les tâches entre différents agents (les travailleurs) et aggrège ensuite les résultats. Chaque agent peut tourner sur son propre modèle et est spécifique à sa tâche
- Plan-and-Execute : Cette technique permet de réfléchir à la stratégie d'exécution en amont. Une fois la stratégie déterminée, la véritable exécution peut commencer. Cela permet de limiter les appels LLM et de rendre la réponse plus fiable. C'est un peu la différence entre foncer dans le code tête baissée, ou analyser la demande avant d'implémenter une solution.
Et concrètement, quand je prompte basiquement ça me suffit, alors pourquoi faire ?
- Un vocabulaire commun lorsqu'une approche est mise en oeuvre. Vous pouvez dire à vos équipe "sur ce sujet, on met en place un Orchestrator–Workers" et tout le monde saura ce dont il s'agit.
- Des solutions pensées et validées. Ces patterns ont emergés et ont été adoptés par la communauté car ils fonctionnent.
- Des choix d'architecture éclairés. Chaque pattern a ses compromis : coût, latence, robustesse, complexité. Les connaître, c'est pouvoir choisir le bon outil pour le bon problème — un Tree-of-Thoughts est puissant mais cher, un simple pipeline séquentiel est prévisible mais rigide.
- Une montée en compétence rapide. Ces patterns sont des mécanismes et des architectures "clé en main". Il devient donc facile de se les approprier.
Conclusion
Un pattern de conception agentique, c'est une recette réutilisable pour construire des agents IA : un nom, un schéma, un problème résolu. Comme les design patterns, ils ne sont pas une fin en soi, mais un outil de pensée pour concevoir de manière plus efficace. Et bonne nouvelle : dans les prochains articles, j'en décrirai certains en profondeur !
En attendant, j'ai fait travaillé mes agents et ils m'ont généré… Un tableau récapitulatif des architectures et patterns agentiques qui existent actuellement. Allé, je le partage ici 😊
| Nom | Cas d'usage | Explications |
|---|---|---|
| ReAct | Agents avec outils, recherche web | Boucle thought/action/observation : standard de fait des agents outillés. |
| Function Calling / Toolformer | Intégrations API, données externes | Base de la plupart des frameworks ; le modèle émet des appels structurés. |
| Chain-of-Thought (CoT) | Maths, logique, problèmes multi-étapes | Forcer le modèle à « penser à voix haute » améliore la fiabilité sur les tâches qui exigent du raisonnement séquentiel. |
| Agentic RAG | QA sur corpus, assistants documentaires | Récupération dynamique et itérative plutôt que one-shot. |
| Orchestrator–Workers | Tâches composées, pipelines complexes | Un cerveau central répartit et agrège ; flexible et lisible. |
| Router / Routing | Multi-domaines, sélection de modèle/outil | Dirige chaque requête vers le sous-système le plus apte. |
| Sequential / Pipeline | Workflows déterministes par étapes | Simple et prévisible ; peu de flexibilité. |
| Memory-augmented | Assistants persistants, personnalisation | Conserve le contexte au-delà de la fenêtre courante. |
| Plan-and-Execute | Tâches longues multi-étapes | Sépare la stratégie de l'exécution ; moins d'appels LLM que ReAct pur. |
| Self-Refine | Rédaction, code, amélioration qualité | Itération auto-critique sans données externes. |
| Critic / Reflection | Revue de code, contrôle qualité | Sépare la génération de l'évaluation pour attraper les erreurs. |
| Evaluator-Optimizer | Optimisation qualité, traduction, code | Itère jusqu'à satisfaire un critère mesurable. |
| Role-based collaboration | Simulation d'équipe (CrewAI, MetaGPT, AutoGen) | Des rôles spécialisés coopèrent comme une équipe humaine. |
| Reflexion | Tâches avec essais répétés, code | Garde un retour textuel entre tentatives pour ne pas répéter ses erreurs. |
| Self-Consistency | QA, maths à réponse unique | Compense l'aléa d'un seul raisonnement en gardant la réponse la plus fréquente. |
| Tree-of-Thoughts (ToT) | Énigmes, planification, jeux | Évalue plusieurs chemins et abandonne les impasses ; coûteux mais robuste. |
| Hierarchical / Manager-Subagents | Très gros projets, organisation par domaine | Mise à l'échelle par couches de supervision. |
| Plan-and-Reflect | Environnements changeants | Replanifie quand la réalité diffère du plan initial. |
| CodeAct | Agents data, automatisation système | Plus expressif que des appels JSON : boucles, conditions, composition. |
| Network / Swarm | Routage dynamique, service client (OpenAI Swarm) | Pas de chef ; le contrôle circule selon le besoin. |
| Multi-Agent Debate | Raisonnement difficile, réduction d'hallucinations | La confrontation des points de vue affine la réponse. |
| LATS | Décisions complexes, planification outillée | Combine recherche, action et apprentissage par retour ; puissant mais lourd. |
| ReWOO | Réduire le coût LLM, appels d'outils nombreux | Planifie tous les appels d'avance pour éviter un aller-retour LLM par étape. |
| PAL (Program-Aided Language) | Calcul, dates, manipulation symbolique | Le langage naturel planifie, l'interpréteur calcule (zéro erreur arithmétique). |
| Least-to-Most | Tâches compositionnelles, généralisation | Résoudre d'abord le facile puis réutiliser le résultat pour le difficile. |
| Graph-of-Thoughts (GoT) | Problèmes où des sous-solutions se combinent | Généralise ToT : permet d'agréger/recombiner des idées, pas seulement de brancher. |
| Skeleton-of-Thought | Rédaction longue, réponses structurées | Réduit la latence en remplissant les points en parallèle. |
| Blackboard | Systèmes experts, fusion de sources | Les agents lisent/écrivent sur un état partagé plutôt qu'en direct. |