Saltar al contenido
Lección 4 de 5

Orquestación Multi-Agente

4 min read

Por Qué los Agentes Individuales Alcanzan Límites

Un agente individual puede manejar mucho, pero algunas tareas son inherentemente demasiado complejas para una sola cadena de razonamiento. Considera una evaluación de seguridad: necesitas escanear infraestructura, analizar código, revisar configuraciones, verificar compliance y sintetizar hallazgos. Un solo agente intentando hacer todo esto pierde foco, alcanza límites de contexto y produce resultados superficiales.

Los sistemas multi-agente resuelven esto dividiendo el trabajo cognitivo. Cada agente se especializa, y una capa de orquestación coordina su trabajo.

Patrones Multi-Agente

Supervisor

Un agente actúa como manager, delegando tareas a agentes especialistas y sintetizando sus resultados. El supervisor decide qué necesita hacerse, asigna trabajo, revisa outputs y maneja conflictos.

Agente Supervisor
  ├── Agente Scanner de Seguridad
  ├── Agente Revisor de Código
  ├── Agente Verificador de Compliance
  └── Agente Escritor de Reportes

Ideal para: tareas donde una autoridad central necesita coordinar subtareas diversas y tomar decisiones finales.

Pipeline

Los agentes se organizan secuencialmente — el output de cada agente se convierte en el input del siguiente. Piensa en una línea de ensamblaje donde cada estación agrega valor.

Agente Requisitos → Agente Diseño → Agente Código → Agente Revisión → Agente Testing

Ideal para: flujos de trabajo con etapas claras donde el output de cada etapa está bien definido.

Debate

Múltiples agentes analizan el mismo problema independientemente, luego un agente juez evalúa sus argumentos. Esto revela puntos ciegos y produce conclusiones más robustas.

Ideal para: decisiones de alto impacto, code review (múltiples revisores detectan más problemas) y situaciones donde perspectivas diversas mejoran la calidad.

Swarm

Un pool de agentes similares trabaja en una colección de tareas. Un dispatcher asigna tareas dinámicamente según disponibilidad y capacidad. Sin jerarquía estricta — los agentes se auto-organizan.

Ideal para: procesar grandes lotes de tareas similares en paralelo, como revisar cientos de pull requests o escanear múltiples repositorios.

Comunicación Entre Agentes

Los agentes necesitan compartir información efectivamente:

Contexto compartido: Todos los agentes leen y escriben en una base de conocimiento común. Simple pero puede llevar a conflictos y sobrecarga de información.

Paso de mensajes: Los agentes se comunican a través de mensajes estructurados. Más controlado pero requiere definir un protocolo de mensajes.

Arquitectura blackboard: Un espacio de trabajo compartido donde los agentes publican hallazgos y leen las contribuciones de otros. El blackboard sirve como canal de comunicación y memoria colectiva. Este patrón funciona bien cuando los agentes necesitan construir sobre el trabajo de otros sin acoplamiento fuerte.

Descomposición de Tareas

El supervisor (u orquestador) debe descomponer objetivos complejos en subtareas asignables. La descomposición efectiva sigue estos principios:

  • Independencia: Las subtareas deben ser lo más independientes posible para permitir ejecución en paralelo.
  • Límites claros: Cada subtarea tiene inputs, outputs y criterios de éxito bien definidos.
  • Granularidad correcta: Muy grueso y los agentes tienen problemas; muy fino y el overhead domina.

Monitoreo y Observabilidad

Los sistemas multi-agente son más difíciles de depurar que los agentes individuales. Prácticas esenciales:

Logging estructurado: Cada acción, decisión y comunicación de los agentes se loggea con timestamps e IDs de agente. Usa herramientas como OpenTelemetry para tracing distribuido.

Tracking de tokens y costos: El uso de tokens de cada agente se trackea independientemente. Esto revela qué agentes son eficientes y cuáles son desperdiciadores.

Auditoría de decisiones: Cuando algo sale mal, necesitas rastrear la cadena de decisiones. ¿Por qué el supervisor asignó esta tarea? ¿Por qué el agente eligió este enfoque?

Gestión de Costos

Los sistemas multi-agente multiplican costos. Estrategias clave:

  • Usa modelos más baratos para agentes simples — no todo agente necesita un modelo frontier. Un dispatcher o formateador puede correr en un modelo más pequeño.
  • Cachea agresivamente — si múltiples agentes necesitan los mismos datos, recupéralos una vez.
  • Establece presupuestos duros de tokens por agente y por tarea.
  • Short-circuit — si un agente temprano determina que la tarea es trivial, salta las etapas restantes del pipeline.

Sistemas del mundo real como pipelines de code review, equipos de evaluación de seguridad y flujos de trabajo de investigación se benefician de la orquestación multi-agente — pero solo cuando la complejidad agregada está justificada por la tarea en cuestión.