TECNICO

Sitemap

Archivo XML que lista todas las URLs de tu sitio para que los buscadores las descubran e indexen. Imprescindible para SEO en sitios con muchas páginas.

Nivel · principiante3 min de lecturaActualizado 22 may 2026
También conocido como: Mapa del sitio, Sitemap.xml

Definición

Un sitemap (mapa del sitio) es un archivo XML que lista todas las URLs públicas de tu sitio web junto con metadatos opcionales (fecha de última modificación, frecuencia de cambio, prioridad). Su función principal: facilitar a los buscadores (Google, Bing, Yandex) que descubran e indexen todas tus páginas.

Aunque Google es capaz de encontrar páginas siguiendo enlaces internos, un sitemap garantiza que ninguna se quede fuera, especialmente las que están profundas en la estructura o tienen pocos enlaces internos. Es imprescindible en sitios con más de 50-100 páginas y muy recomendable en cualquiera.

Se publica típicamente en https://tudominio.com/sitemap.xml y se referencia desde el robots.txt.

Estructura básica

Un sitemap mínimo:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>https://imdica.es/</loc>
    <lastmod>2026-05-20</lastmod>
    <changefreq>monthly</changefreq>
    <priority>1.0</priority>
  </url>
  <url>
    <loc>https://imdica.es/productos</loc>
    <lastmod>2026-05-15</lastmod>
    <changefreq>weekly</changefreq>
    <priority>0.8</priority>
  </url>
</urlset>
TagFunción
<loc>URL absoluta (obligatorio)
<lastmod>Última modificación (recomendado, ayuda a re-crawl)
<changefreq>Frecuencia estimada de cambio (daily, weekly, monthly...)
<priority>Prioridad relativa de 0.0 a 1.0

Google declara que ignora changefreq y priority, pero sí usa lastmod. El resto sirve más para Bing y otros.

Sitemap index (sitios grandes)

Un sitemap individual puede contener hasta 50.000 URLs o 50 MB. Si tu sitio es más grande, usa un sitemap index que apunta a varios sitemaps:

<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <sitemap>
    <loc>https://imdica.es/sitemap-productos.xml</loc>
    <lastmod>2026-05-20</lastmod>
  </sitemap>
  <sitemap>
    <loc>https://imdica.es/sitemap-blog.xml</loc>
    <lastmod>2026-05-19</lastmod>
  </sitemap>
</sitemapindex>

Cómo generarlo

Manualmente

Para sitios pequeños (< 20 URLs) puedes mantenerlo a mano. No es práctico a más escala.

Plugins / módulos del CMS

  • WordPress: Yoast SEO, Rank Math, All in One SEO generan sitemap automáticamente
  • Shopify: sitemap.xml está disponible por defecto
  • PrestaShop: módulos como "Google Sitemap"
  • Webflow / Wix / Squarespace: lo generan ellos

Frameworks modernos (Next.js, Astro, etc.)

Generación dinámica leyendo tus rutas. En Next.js 14+:

// src/app/sitemap.ts
import type { MetadataRoute } from 'next';

export default async function sitemap(): Promise<MetadataRoute.Sitemap> {
  return [
    { url: 'https://imdica.es/', lastModified: new Date(), priority: 1 },
    { url: 'https://imdica.es/productos', lastModified: new Date(), priority: 0.8 },
    // ... etc
  ];
}

Generadores online

Si todo lo anterior falla: xml-sitemaps.com crawlea tu web y genera el XML.

Cómo enviarlo a Google

  1. Sube sitemap.xml a la raíz de tu dominio
  2. Añade en robots.txt:
    Sitemap: https://tudominio.com/sitemap.xml
    
  3. Ve a Google Search Console → tu propiedad → Sitemaps
  4. Introduce sitemap.xml y dale a "Enviar"
  5. Google empieza a procesarlo en horas. La indexación completa puede tardar semanas

Errores comunes

  • Incluir URLs con noindex: si una URL tiene <meta robots="noindex">, no la metas en el sitemap — confunde a Google
  • Incluir URLs canónicas alternativas: solo URLs canónicas, no duplicados
  • URLs relativas: deben ser absolutas con protocolo (https://...)
  • Olvidar <lastmod> o ponerla siempre como "hoy": Google detecta el truco y deja de confiar en el dato. Solo cambia lastmod cuando el contenido realmente cambia
  • No actualizar el sitemap al añadir páginas nuevas: si tu CMS no lo genera dinámicamente, automatízalo con un cron
  • No referenciarlo desde robots.txt: no es estrictamente necesario (lo envías por Search Console) pero ayuda a otros buscadores
  • Sitemap roto (XML mal formado, URLs 404, etc.): Search Console te lo dice — revisa los errores periódicamente

Cuándo lo necesitas sí o sí

  • Sitios con muchas páginas (>50)
  • E-commerce con catálogo extenso
  • Blogs con muchos artículos
  • Sitios nuevos sin enlaces externos (sin backlinks Google tarda más en descubrir tu home)
  • Sitios con contenido dinámico (filtros, paginación, etiquetas)
  • Cualquier sitio que quiera control sobre qué se indexa

Referencias

Tagsseo-tecnicogoogleindexacioncrawling