Definición
Un agente IA (en inglés AI agent o agentic system) es un sistema en el que un LLM actúa como cerebro de un bucle de decisión: recibe un objetivo, decide qué hacer, usa herramientas externas (APIs, código, búsqueda, bases de datos), observa el resultado y decide el siguiente paso. Repite hasta que considera el objetivo cumplido.
A diferencia de un chatbot tradicional —que responde un mensaje y termina—, un agente puede ejecutar tareas en múltiples pasos, tomar decisiones autónomas, manejar errores, recuperarse y producir resultados que requieren orquestar varias acciones.
El paradigma "agentic" es el tema dominante de 2026 en aplicación de IA: Claude Code, Cursor, Devin, OpenAI Operator, Anthropic Computer Use, Google Project Astra. Todos son agentes que automatizan tareas que antes requerían humanos con paciencia y manos.
Cómo funciona
El bucle típico de un agente:
- Recibe objetivo: instrucción del usuario o evento que dispara una tarea.
- Planifica: el LLM razona sobre qué pasos seguir. A veces explícito (genera un plan), a veces implícito.
- Decide la siguiente acción: el LLM elige una herramienta a invocar y construye los argumentos.
- Ejecuta: el sistema invoca la herramienta (llamada a API, ejecución de código, búsqueda web).
- Observa el resultado: la salida vuelve al LLM como nueva entrada del contexto.
- Itera: el LLM evalúa si el objetivo está cumplido. Si no, vuelve al paso 3.
Cada iteración aumenta el contexto. Por eso los agentes consumen muchos más tokens que un chatbot — pueden ser decenas de pasos para tareas complejas.
Componentes técnicos
Un agente serio combina:
- LLM con capacidad de razonamiento y tool use (function calling).
- Conjunto de herramientas (tools): cada una con esquema definido (nombre, descripción, parámetros).
- Sistema de prompt que explica al modelo cómo elegir herramientas y formato de salida.
- Memoria de corto plazo: el historial de la conversación/sesión.
- Memoria de largo plazo opcional: vector store con experiencias previas, o estado persistente.
- Loop de ejecución: código que orquesta las llamadas LLM ↔ herramientas.
- Mecanismos de seguridad: límites de pasos, timeouts, validación, sandboxing.
Patrones de agentes
Los principales paradigmas:
- ReAct (Reasoning + Acting): el modelo alterna entre "pensar" y "actuar" en cada paso, explicitando ambos en el prompt. Es el patrón más extendido.
- Plan-and-Execute: primero el LLM genera un plan completo; luego un sub-agente ejecuta cada paso. Más estructurado, mejor para tareas largas.
- Tree of Thought: explora varios caminos en paralelo y se queda con el mejor. Caro pero potente.
- Multi-agent: varios agentes colaboran, cada uno con rol especializado (planner, ejecutor, crítico). CrewAI, AutoGen popularizan este enfoque.
- Reflexion: el agente se autocritica tras cada intento y mejora iterativamente.
- Code as plan: el LLM genera código que el sistema ejecuta. Más controlable y verificable que tool use libre.
Tool use y function calling
La pieza clave técnica: cómo un LLM "llama" a una herramienta. Los modelos modernos (Claude, GPT, Gemini) tienen function calling nativo: les das un esquema JSON con las funciones disponibles y el modelo decide cuándo y cómo invocarlas.
Ejemplo de definición de herramienta:
{
"name": "buscar_pedidos",
"description": "Busca pedidos en el ERP de IMDICA por número de cliente y rango de fechas",
"parameters": {
"type": "object",
"properties": {
"cliente_id": { "type": "string" },
"fecha_desde": { "type": "string", "format": "date" },
"fecha_hasta": { "type": "string", "format": "date" }
},
"required": ["cliente_id"]
}
}
Cuando el usuario dice "muéstrame los pedidos del cliente 4521 de marzo", el LLM genera:
{
"function": "buscar_pedidos",
"arguments": {
"cliente_id": "4521",
"fecha_desde": "2026-03-01",
"fecha_hasta": "2026-03-31"
}
}
El backend ejecuta esa función, devuelve resultados, y el LLM los formatea como respuesta natural al usuario.
Ejemplo práctico
Imaginemos un agente que ayuda al equipo comercial de IMDICA a preparar propuestas. El usuario dice:
"Prepara una propuesta para Construcciones Soler, basada en su histórico de compras y con precios actualizados de los productos del catálogo de electroportátil."
El agente:
- Llama a
buscar_clientecon "Construcciones Soler" → obtiene cliente_id 8821 y datos básicos. - Llama a
historico_pedidoscon cliente_id 8821 → 24 pedidos del último año, top productos identificados. - Llama a
catalogo_categoriacon "electroportátil" → 47 productos, precios actuales. - Cruza ambos: detecta que Soler compra mucho de Makita y Bosch.
- Llama a
descuentos_clientecon cliente_id 8821 → tiene descuento 8% por volumen. - Llama a
generar_pdf_propuestacon los datos cruzados → produce el PDF. - Llama a
enviar_emailcon destinatario, asunto y adjunto. - Confirma al usuario: "Propuesta enviada a cuentas@construccionessoler.es. 28 productos seleccionados, descuento 8% aplicado. Total: 14.230 €."
Una tarea que llevaría a un comercial 45 minutos, hecha en 12 segundos por un agente bien construido. Y verificable: cada llamada queda registrada con sus parámetros y resultado.
Por qué es el paradigma del momento
Razones técnicas:
- Modelos top alcanzaron umbral de fiabilidad: Claude Opus 4, GPT-5 ya hacen tool use con tasa de éxito >90% en tareas razonables.
- Function calling estandarizado: ya no hay que hackear con regex; los modelos lo manejan nativo.
- Ventanas de contexto enormes: 200k-2M tokens permiten conversaciones agente largas sin perder memoria.
- MCP (Model Context Protocol): estándar emergente de Anthropic que estandariza cómo agentes se conectan a herramientas, datos y entornos.
- Modelos de razonamiento (DeepSeek R1, o1, Claude Extended Thinking): permiten al agente "pensar" antes de actuar.
Razones de negocio:
- Automatiza trabajos antes inviables: soporte multicapa, análisis de datos no estructurados, generación documental compleja.
- Reemplaza scripts frágiles: un agente puede manejar excepciones que un script rompería.
- Escala sin proporcionalidad lineal en personas: una empresa puede multiplicar capacidad sin contratar al mismo ritmo.
Errores comunes al construir agentes
- Confiar en que el LLM "decidirá bien siempre": necesita herramientas bien diseñadas, prompts cuidadosos y guardrails.
- No limitar el número de pasos: un agente puede entrar en bucles. Pon límite duro (10-30 pasos típico).
- Tools demasiado abiertas: una
run_arbitrary_sqles un riesgo masivo. Mejor herramientas estrechas y específicas. - No validar outputs: el LLM puede inventar argumentos malformados. Valida antes de ejecutar.
- Ignorar el coste: agentes consumen muchos tokens. Mide y optimiza desde el inicio.
- No tener logging: si algo falla, sin trazas no entiendes qué pasó. Cada paso debe quedar registrado.
- No considerar seguridad: agentes con acceso a producción son vector de ataque. Principio de mínimo privilegio.
- Sobrediseñar con multi-agent: muchos casos se resuelven con un solo agente bien hecho. No empieces multi-agent sin necesidad real.
Cuándo construir un agente
Sí, plantéatelo cuando:
- La tarea requiere varios pasos y decisiones que dependen de resultados intermedios.
- Hay herramientas/APIs que necesitan orquestación dinámica.
- El input es ambiguo o complejo y un flujo determinista sería frágil.
- El valor por ejecución compensa el coste de tokens y compute.
No es la herramienta correcta cuando:
- Un flujo determinista (workflow tradicional) funciona perfectamente.
- La latencia debe ser baja y predecible (los agentes son lentos por naturaleza).
- El coste por tarea no se sostiene económicamente.
- La fiabilidad debe ser 100% (los agentes fallan a veces; planifica retries y fallbacks).
Referencias
- Anthropic · Building effective agents — guía oficial de Anthropic con patrones de referencia
- Yao et al. · ReAct paper — el paper que estableció el patrón de razonamiento + acción
- Model Context Protocol (MCP) — estándar emergente para conectar agentes a herramientas y datos