PATRONES

Agente IA

Sistema en el que un LLM toma decisiones autónomas, usa herramientas externas y ejecuta tareas en varios pasos hasta cumplir un objetivo, en lugar de limitarse a responder un mensaje.

Nivel · avanzado6 min de lecturaActualizado 23 may 2026

También conocido como: AI Agent, Agentic system, Agente autónomo, Agente LLM

Definición

Un agente IA (en inglés AI agent o agentic system) es un sistema en el que un LLM actúa como cerebro de un bucle de decisión: recibe un objetivo, decide qué hacer, usa herramientas externas (APIs, código, búsqueda, bases de datos), observa el resultado y decide el siguiente paso. Repite hasta que considera el objetivo cumplido.

A diferencia de un chatbot tradicional —que responde un mensaje y termina—, un agente puede ejecutar tareas en múltiples pasos, tomar decisiones autónomas, manejar errores, recuperarse y producir resultados que requieren orquestar varias acciones.

El paradigma "agentic" es el tema dominante de 2026 en aplicación de IA: Claude Code, Cursor, Devin, OpenAI Operator, Anthropic Computer Use, Google Project Astra. Todos son agentes que automatizan tareas que antes requerían humanos con paciencia y manos.

Cómo funciona

El bucle típico de un agente:

Recibe objetivo: instrucción del usuario o evento que dispara una tarea.
Planifica: el LLM razona sobre qué pasos seguir. A veces explícito (genera un plan), a veces implícito.
Decide la siguiente acción: el LLM elige una herramienta a invocar y construye los argumentos.
Ejecuta: el sistema invoca la herramienta (llamada a API, ejecución de código, búsqueda web).
Observa el resultado: la salida vuelve al LLM como nueva entrada del contexto.
Itera: el LLM evalúa si el objetivo está cumplido. Si no, vuelve al paso 3.

Cada iteración aumenta el contexto. Por eso los agentes consumen muchos más tokens que un chatbot — pueden ser decenas de pasos para tareas complejas.

Componentes técnicos

Un agente serio combina:

LLM con capacidad de razonamiento y tool use (function calling).
Conjunto de herramientas (tools): cada una con esquema definido (nombre, descripción, parámetros).
Sistema de prompt que explica al modelo cómo elegir herramientas y formato de salida.
Memoria de corto plazo: el historial de la conversación/sesión.
Memoria de largo plazo opcional: vector store con experiencias previas, o estado persistente.
Loop de ejecución: código que orquesta las llamadas LLM ↔ herramientas.
Mecanismos de seguridad: límites de pasos, timeouts, validación, sandboxing.

Patrones de agentes

Los principales paradigmas:

ReAct (Reasoning + Acting): el modelo alterna entre "pensar" y "actuar" en cada paso, explicitando ambos en el prompt. Es el patrón más extendido.
Plan-and-Execute: primero el LLM genera un plan completo; luego un sub-agente ejecuta cada paso. Más estructurado, mejor para tareas largas.
Tree of Thought: explora varios caminos en paralelo y se queda con el mejor. Caro pero potente.
Multi-agent: varios agentes colaboran, cada uno con rol especializado (planner, ejecutor, crítico). CrewAI, AutoGen popularizan este enfoque.
Reflexion: el agente se autocritica tras cada intento y mejora iterativamente.
Code as plan: el LLM genera código que el sistema ejecuta. Más controlable y verificable que tool use libre.

Tool use y function calling

La pieza clave técnica: cómo un LLM "llama" a una herramienta. Los modelos modernos (Claude, GPT, Gemini) tienen function calling nativo: les das un esquema JSON con las funciones disponibles y el modelo decide cuándo y cómo invocarlas.

Ejemplo de definición de herramienta:

{
  "name": "buscar_pedidos",
  "description": "Busca pedidos en el ERP de IMDICA por número de cliente y rango de fechas",
  "parameters": {
    "type": "object",
    "properties": {
      "cliente_id": { "type": "string" },
      "fecha_desde": { "type": "string", "format": "date" },
      "fecha_hasta": { "type": "string", "format": "date" }
    },
    "required": ["cliente_id"]
  }
}

Cuando el usuario dice "muéstrame los pedidos del cliente 4521 de marzo", el LLM genera:

{
  "function": "buscar_pedidos",
  "arguments": {
    "cliente_id": "4521",
    "fecha_desde": "2026-03-01",
    "fecha_hasta": "2026-03-31"
  }
}

El backend ejecuta esa función, devuelve resultados, y el LLM los formatea como respuesta natural al usuario.

Ejemplo práctico

Imaginemos un agente que ayuda al equipo comercial de IMDICA a preparar propuestas. El usuario dice:

"Prepara una propuesta para Construcciones Soler, basada en su histórico de compras y con precios actualizados de los productos del catálogo de electroportátil."

El agente:

Llama a buscar_cliente con "Construcciones Soler" → obtiene cliente_id 8821 y datos básicos.
Llama a historico_pedidos con cliente_id 8821 → 24 pedidos del último año, top productos identificados.
Llama a catalogo_categoria con "electroportátil" → 47 productos, precios actuales.
Cruza ambos: detecta que Soler compra mucho de Makita y Bosch.
Llama a descuentos_cliente con cliente_id 8821 → tiene descuento 8% por volumen.
Llama a generar_pdf_propuesta con los datos cruzados → produce el PDF.
Llama a enviar_email con destinatario, asunto y adjunto.
Confirma al usuario: "Propuesta enviada a cuentas@construccionessoler.es. 28 productos seleccionados, descuento 8% aplicado. Total: 14.230 €."

Una tarea que llevaría a un comercial 45 minutos, hecha en 12 segundos por un agente bien construido. Y verificable: cada llamada queda registrada con sus parámetros y resultado.

Por qué es el paradigma del momento

Razones técnicas:

Modelos top alcanzaron umbral de fiabilidad: Claude Opus 4, GPT-5 ya hacen tool use con tasa de éxito >90% en tareas razonables.
Function calling estandarizado: ya no hay que hackear con regex; los modelos lo manejan nativo.
Ventanas de contexto enormes: 200k-2M tokens permiten conversaciones agente largas sin perder memoria.
MCP (Model Context Protocol): estándar emergente de Anthropic que estandariza cómo agentes se conectan a herramientas, datos y entornos.
Modelos de razonamiento (DeepSeek R1, o1, Claude Extended Thinking): permiten al agente "pensar" antes de actuar.

Razones de negocio:

Automatiza trabajos antes inviables: soporte multicapa, análisis de datos no estructurados, generación documental compleja.
Reemplaza scripts frágiles: un agente puede manejar excepciones que un script rompería.
Escala sin proporcionalidad lineal en personas: una empresa puede multiplicar capacidad sin contratar al mismo ritmo.

Errores comunes al construir agentes

Confiar en que el LLM "decidirá bien siempre": necesita herramientas bien diseñadas, prompts cuidadosos y guardrails.
No limitar el número de pasos: un agente puede entrar en bucles. Pon límite duro (10-30 pasos típico).
Tools demasiado abiertas: una run_arbitrary_sql es un riesgo masivo. Mejor herramientas estrechas y específicas.
No validar outputs: el LLM puede inventar argumentos malformados. Valida antes de ejecutar.
Ignorar el coste: agentes consumen muchos tokens. Mide y optimiza desde el inicio.
No tener logging: si algo falla, sin trazas no entiendes qué pasó. Cada paso debe quedar registrado.
No considerar seguridad: agentes con acceso a producción son vector de ataque. Principio de mínimo privilegio.
Sobrediseñar con multi-agent: muchos casos se resuelven con un solo agente bien hecho. No empieces multi-agent sin necesidad real.

Cuándo construir un agente

Sí, plantéatelo cuando:

La tarea requiere varios pasos y decisiones que dependen de resultados intermedios.
Hay herramientas/APIs que necesitan orquestación dinámica.
El input es ambiguo o complejo y un flujo determinista sería frágil.
El valor por ejecución compensa el coste de tokens y compute.

No es la herramienta correcta cuando:

Un flujo determinista (workflow tradicional) funciona perfectamente.
La latencia debe ser baja y predecible (los agentes son lentos por naturaleza).
El coste por tarea no se sostiene económicamente.
La fiabilidad debe ser 100% (los agentes fallan a veces; planifica retries y fallbacks).

Referencias

Anthropic · Building effective agents — guía oficial de Anthropic con patrones de referencia
Yao et al. · ReAct paper — el paper que estableció el patrón de razonamiento + acción
Model Context Protocol (MCP) — estándar emergente para conectar agentes a herramientas y datos

Tagsiaagentesautomatizaciónorquestación

TÉRMINOS RELACIONADOS

Explora también

Inteligencia Artificial

LLM

Modelo de lenguaje de gran tamaño basado en redes neuronales tipo transformer, entrenado con cantidades masivas de texto para predecir el siguiente token de una secuencia.

Leer

Inteligencia Artificial

Transformer

Arquitectura de red neuronal basada en el mecanismo de atención que procesa secuencias en paralelo. Es la base de todos los grandes modelos modernos: GPT, Claude, Gemini, Llama.

Leer

Inteligencia Artificial

RAG

Patrón arquitectónico que combina un LLM con un sistema de recuperación: antes de generar respuesta, el modelo busca información relevante en una base externa y la incluye en su contexto.

Leer

Inteligencia Artificial

Inference

Proceso de usar un modelo ya entrenado para generar predicciones o respuestas en tiempo real. Es la fase de explotación: cada vez que llamas a un LLM en producción, estás haciendo inference.

Leer

Inteligencia Artificial

Fine-tuning

Proceso de tomar un modelo preentrenado y continuar su entrenamiento con datos específicos para adaptarlo a una tarea, dominio o estilo concretos.

Leer

Inteligencia Artificial

Function calling

Capacidad de un LLM para invocar herramientas externas estructuradas decidiendo qué función llamar y con qué argumentos, en lugar de limitarse a generar texto.

Leer

← Volver al diccionario de Inteligencia Artificial