PATRONES

Agente IA

Sistema en el que un LLM toma decisiones autónomas, usa herramientas externas y ejecuta tareas en varios pasos hasta cumplir un objetivo, en lugar de limitarse a responder un mensaje.

Nivel · avanzado6 min de lecturaActualizado 23 may 2026
También conocido como: AI Agent, Agentic system, Agente autónomo, Agente LLM

Definición

Un agente IA (en inglés AI agent o agentic system) es un sistema en el que un LLM actúa como cerebro de un bucle de decisión: recibe un objetivo, decide qué hacer, usa herramientas externas (APIs, código, búsqueda, bases de datos), observa el resultado y decide el siguiente paso. Repite hasta que considera el objetivo cumplido.

A diferencia de un chatbot tradicional —que responde un mensaje y termina—, un agente puede ejecutar tareas en múltiples pasos, tomar decisiones autónomas, manejar errores, recuperarse y producir resultados que requieren orquestar varias acciones.

El paradigma "agentic" es el tema dominante de 2026 en aplicación de IA: Claude Code, Cursor, Devin, OpenAI Operator, Anthropic Computer Use, Google Project Astra. Todos son agentes que automatizan tareas que antes requerían humanos con paciencia y manos.

Cómo funciona

El bucle típico de un agente:

  1. Recibe objetivo: instrucción del usuario o evento que dispara una tarea.
  2. Planifica: el LLM razona sobre qué pasos seguir. A veces explícito (genera un plan), a veces implícito.
  3. Decide la siguiente acción: el LLM elige una herramienta a invocar y construye los argumentos.
  4. Ejecuta: el sistema invoca la herramienta (llamada a API, ejecución de código, búsqueda web).
  5. Observa el resultado: la salida vuelve al LLM como nueva entrada del contexto.
  6. Itera: el LLM evalúa si el objetivo está cumplido. Si no, vuelve al paso 3.

Cada iteración aumenta el contexto. Por eso los agentes consumen muchos más tokens que un chatbot — pueden ser decenas de pasos para tareas complejas.

Componentes técnicos

Un agente serio combina:

  • LLM con capacidad de razonamiento y tool use (function calling).
  • Conjunto de herramientas (tools): cada una con esquema definido (nombre, descripción, parámetros).
  • Sistema de prompt que explica al modelo cómo elegir herramientas y formato de salida.
  • Memoria de corto plazo: el historial de la conversación/sesión.
  • Memoria de largo plazo opcional: vector store con experiencias previas, o estado persistente.
  • Loop de ejecución: código que orquesta las llamadas LLM ↔ herramientas.
  • Mecanismos de seguridad: límites de pasos, timeouts, validación, sandboxing.

Patrones de agentes

Los principales paradigmas:

  • ReAct (Reasoning + Acting): el modelo alterna entre "pensar" y "actuar" en cada paso, explicitando ambos en el prompt. Es el patrón más extendido.
  • Plan-and-Execute: primero el LLM genera un plan completo; luego un sub-agente ejecuta cada paso. Más estructurado, mejor para tareas largas.
  • Tree of Thought: explora varios caminos en paralelo y se queda con el mejor. Caro pero potente.
  • Multi-agent: varios agentes colaboran, cada uno con rol especializado (planner, ejecutor, crítico). CrewAI, AutoGen popularizan este enfoque.
  • Reflexion: el agente se autocritica tras cada intento y mejora iterativamente.
  • Code as plan: el LLM genera código que el sistema ejecuta. Más controlable y verificable que tool use libre.

Tool use y function calling

La pieza clave técnica: cómo un LLM "llama" a una herramienta. Los modelos modernos (Claude, GPT, Gemini) tienen function calling nativo: les das un esquema JSON con las funciones disponibles y el modelo decide cuándo y cómo invocarlas.

Ejemplo de definición de herramienta:

{
  "name": "buscar_pedidos",
  "description": "Busca pedidos en el ERP de IMDICA por número de cliente y rango de fechas",
  "parameters": {
    "type": "object",
    "properties": {
      "cliente_id": { "type": "string" },
      "fecha_desde": { "type": "string", "format": "date" },
      "fecha_hasta": { "type": "string", "format": "date" }
    },
    "required": ["cliente_id"]
  }
}

Cuando el usuario dice "muéstrame los pedidos del cliente 4521 de marzo", el LLM genera:

{
  "function": "buscar_pedidos",
  "arguments": {
    "cliente_id": "4521",
    "fecha_desde": "2026-03-01",
    "fecha_hasta": "2026-03-31"
  }
}

El backend ejecuta esa función, devuelve resultados, y el LLM los formatea como respuesta natural al usuario.

Ejemplo práctico

Imaginemos un agente que ayuda al equipo comercial de IMDICA a preparar propuestas. El usuario dice:

"Prepara una propuesta para Construcciones Soler, basada en su histórico de compras y con precios actualizados de los productos del catálogo de electroportátil."

El agente:

  1. Llama a buscar_cliente con "Construcciones Soler" → obtiene cliente_id 8821 y datos básicos.
  2. Llama a historico_pedidos con cliente_id 8821 → 24 pedidos del último año, top productos identificados.
  3. Llama a catalogo_categoria con "electroportátil" → 47 productos, precios actuales.
  4. Cruza ambos: detecta que Soler compra mucho de Makita y Bosch.
  5. Llama a descuentos_cliente con cliente_id 8821 → tiene descuento 8% por volumen.
  6. Llama a generar_pdf_propuesta con los datos cruzados → produce el PDF.
  7. Llama a enviar_email con destinatario, asunto y adjunto.
  8. Confirma al usuario: "Propuesta enviada a cuentas@construccionessoler.es. 28 productos seleccionados, descuento 8% aplicado. Total: 14.230 €."

Una tarea que llevaría a un comercial 45 minutos, hecha en 12 segundos por un agente bien construido. Y verificable: cada llamada queda registrada con sus parámetros y resultado.

Por qué es el paradigma del momento

Razones técnicas:

  • Modelos top alcanzaron umbral de fiabilidad: Claude Opus 4, GPT-5 ya hacen tool use con tasa de éxito >90% en tareas razonables.
  • Function calling estandarizado: ya no hay que hackear con regex; los modelos lo manejan nativo.
  • Ventanas de contexto enormes: 200k-2M tokens permiten conversaciones agente largas sin perder memoria.
  • MCP (Model Context Protocol): estándar emergente de Anthropic que estandariza cómo agentes se conectan a herramientas, datos y entornos.
  • Modelos de razonamiento (DeepSeek R1, o1, Claude Extended Thinking): permiten al agente "pensar" antes de actuar.

Razones de negocio:

  • Automatiza trabajos antes inviables: soporte multicapa, análisis de datos no estructurados, generación documental compleja.
  • Reemplaza scripts frágiles: un agente puede manejar excepciones que un script rompería.
  • Escala sin proporcionalidad lineal en personas: una empresa puede multiplicar capacidad sin contratar al mismo ritmo.

Errores comunes al construir agentes

  • Confiar en que el LLM "decidirá bien siempre": necesita herramientas bien diseñadas, prompts cuidadosos y guardrails.
  • No limitar el número de pasos: un agente puede entrar en bucles. Pon límite duro (10-30 pasos típico).
  • Tools demasiado abiertas: una run_arbitrary_sql es un riesgo masivo. Mejor herramientas estrechas y específicas.
  • No validar outputs: el LLM puede inventar argumentos malformados. Valida antes de ejecutar.
  • Ignorar el coste: agentes consumen muchos tokens. Mide y optimiza desde el inicio.
  • No tener logging: si algo falla, sin trazas no entiendes qué pasó. Cada paso debe quedar registrado.
  • No considerar seguridad: agentes con acceso a producción son vector de ataque. Principio de mínimo privilegio.
  • Sobrediseñar con multi-agent: muchos casos se resuelven con un solo agente bien hecho. No empieces multi-agent sin necesidad real.

Cuándo construir un agente

Sí, plantéatelo cuando:

  • La tarea requiere varios pasos y decisiones que dependen de resultados intermedios.
  • Hay herramientas/APIs que necesitan orquestación dinámica.
  • El input es ambiguo o complejo y un flujo determinista sería frágil.
  • El valor por ejecución compensa el coste de tokens y compute.

No es la herramienta correcta cuando:

  • Un flujo determinista (workflow tradicional) funciona perfectamente.
  • La latencia debe ser baja y predecible (los agentes son lentos por naturaleza).
  • El coste por tarea no se sostiene económicamente.
  • La fiabilidad debe ser 100% (los agentes fallan a veces; planifica retries y fallbacks).

Referencias

Tagsiaagentesautomatizaciónorquestación