Přeskočit na hlavní obsah

Vaše mapa stránek dělá pravý opak toho, co si myslíte

Každá URL adresa ve vaší mapě stránek je signál Googlu o tom, co si zaslouží indexování. Většina webů tím přiznává víc, než si uvědomuje.

Vaše mapa stránek dělá pravý opak toho, co si myslíte
Sdílet na LinkedIn

Přes svou XML mapu stránek pošlete Googlu 48 tisíc URL adres. Zaindexuje se jich 11 tisíc. A vy se pořád ptáte, proč Google nechce procházet víc.

Máte to obráceně. Google toho prošel až až. Jen se neshodl s vaší definicí toho, co „stojí za indexování", a to u 77 % toho, co jste poslali.

Vzorec je skoro vždycky stejný. Mapy stránek nacpané stránkami, které by u obsahového auditu nikdo neobhájil, odeslané na autopilota, které Googlu signalizují, že celková kvalita vašeho webu je slabá.

Svoji mapu stránek nejspíš berete jako seznam. Hromadu URL adres, o kterých by Google měl vědět. Pošlete všechno a ať si to Google přebere.

Jenže mapa stránek není tohle.

Každou URL adresou ve své mapě stránek za něco ručíte

Když Googlu pošlete URL adresu, říkáte mu tím čtyři věci. Tahle URL adresa existuje. Je to kanonická verze. Dá se indexovat. Stojí za to ji ukázat ve výsledcích vyhledávání.

Neptáte se. Ručíte za ne.

Pošlete Googlu 48 tisíc URL adres a zaručili jste se 48 tisíckrát. Když jich Google 37 tisíc odmítne, předali jste mu písemný záznam stránek, za které jste se postavili svým jménem – a které neprošly. Každá další URL adresa, kterou zveřejníte, startuje s tímhle handicapem. Google se už naučil, že vašemu úsudku se nedá věřit.

Právě tenhle posun většina SEO specialistů přehlíží. Vaše mapa stránek není žádost, aby Google odvedl víc práce. Je to pečlivě vybraný seznam stránek, podle kterých jste ochotni nechat se posuzovat.

Jakmile to přijmete, vaše výchozí nastavení se překlopí z „zahrňme všechno, co jde" na „zahrňme jen to, co bychom obhájili".

Co vám do ní váš CMS potichu přidá

Většina map stránek nikdy neprošla kontrolou. Prostě se vygenerovaly.

Plugin projel vaši databázi, našel každou URL adresu, o které systém věděl, a všechno nasypal do /sitemap.xml. Výstup nikdo nezkontroloval.

A tak vám v mapě stránek skončí tagové stránky, které nikdo nečte. Autorské archivy redaktorů, kteří odešli před lety. Stránkované archivy typu /blog/page/47. Facetové URL adresy, které kombinují čtyři filtry, jež nikdo nehledá. Výsledky interního vyhledávání. Parametrické URL adresy, které duplikují kanonický obsah. Vyprodané produkty. Prázdné kategorie se dvěma produkty.

Žádná z těchhle stránek si nezaslouží místo ve výsledcích vyhledávání. To, že na vašem webu existují, ještě neznamená, že by je Google měl indexovat.

Vaším prvním krokem při každém auditu mapy stránek je jejich odstranění. Ne přesměrování, ne přidání direktivy noindex. Prostě je z mapy stránek odebrat. Pokud mají nějakou navigační hodnotu, nechte je dostupné pro procházení přes interní odkazy. Jinak je nechte zaniknout.

Základy, na kterých většina map stránek potichu selhává

Většina auditů, které dělám, selže ještě dřív, než se vůbec dostaneme ke kvalitě obsahu. Špatně jsou už základy.

Každá URL adresa musí vracet 200. Ne 301, ne 302, ne 404, ne 5xx. Přesměrovaná URL adresa říká Googlu, že vaše mapa stránek je zastaralá. Stránka, za kterou ručíte, na té adrese už vůbec není. Když do mapy stránek uvedete /old-product/ a ta se přesměruje na /new-product/, vytvořili jste rozpor. Uveďte rovnou finální URL adresu.

Každá URL adresa musí být indexovatelná. Žádná značka meta noindex, žádná hlavička x-robots s hodnotou noindex. Tohle je nejčastější chyba, na kterou narážím. Vaše stránka má přes nějaký plugin nastavený noindex, generátor mapy stránek to nezkontroluje a URL adresa se do ní stejně dostane. Říkáte Googlu naráz dvě protichůdné věci. Google se řídí direktivou na stránce a přestane vaší mapě stránek věřit.

Každá URL adresa musí být svou vlastní kanonickou adresou. Když je v mapě stránek /product?color=red a kanonická URL adresa stránky ukazuje na /product, máte konflikt. Často se zaindexuje ta špatná URL adresa. Nebo žádná.

Každá URL adresa musí být povolená v souboru robots.txt. Uvádět v mapě stránek URL adresy, které jste zablokovali pro procházení, je rozpor, na který dokumentace Googlu výslovně upozorňuje. Pořád na to narážím zhruba u každého třetího auditu.

Lastmod musí být přesný, nebo prázdný. Ten signál je binární. Google mu buď věří, nebo ne. Když váš CMS při každém přegenerování mapy stránek orazítkuje každou URL adresu dnešním datem, rozbili jste lastmod pro celou svou doménu. Nepřesný lastmod je horší než žádný.

Jedna mapa stránek může mít nejvýš 50 tisíc URL adres nebo 50 MB v nekomprimované podobě. Osobně bych šel mnohem níž. Když se weby blíží limitu, pořád vídám problémy se zpracováním. Search Console soubory načte jen částečně nebo je úplně přeskočí. Rozdělte obsah do indexové mapy stránek a držte každý soubor pořádně pod stropem.

Nic z toho není nové. Všechno je to v dokumentaci. A přesto najdu aspoň jedno porušení prakticky v každé mapě stránek, kterou otevřu.

Méně odeslaného, víc zaindexovaného

Vztah mezi velikostí mapy stránek a indexováním je často nepřímý.

Pracoval jsem s weby, které svou mapu stránek zkrátily o 80 % a indexování jim stouplo. Stránky, které to přežijí, přestanou soupeřit o pozornost Googlu s tisícovkami slabých.

Těžko se to přijímá. Když je indexování špatné, váš instinkt tlačí na víc. Víc URL adres, víc map stránek. Správný tah je skoro vždycky opačný.

Mapa stránek s 15 tisíci URL adres, která se indexuje na 96 %, je silnější než ta vaše s 48 tisíci URL adres indexující na 23 %. Vždycky. Ta první je doporučení, kterému Google věří. Ta druhá je šum, který se Google naučil ignorovat.

Jak to opravdu opravit

Začněte tím, že si mapu stránek rozsegmentujete. Kategorie do jedné, produkty do druhé, články do třetí. Procházení to nepomůže, ale jakmile začnete měřit, zviditelní vám to problém s indexováním podle jednotlivých šablon.

Otevřete Google Search Console. Přehled map stránek ukazuje, co Google z každé mapy stránek zpracoval. Přehled Indexování stránek, vyfiltrovaný podle mapy stránek, ukazuje, kolik URL adres z každé se opravdu dostalo do indexu. Porovnejte oba. Když se vaše kategorie indexují na 95 % a produkty na 35 %, přesně víte, kterou šablonu opravit.

Na průběžné sledování mám vlastní nástroj VitalSentinel, který monitoruje indexování konkrétně pro URL adresy z vaší mapy stránek, takže odchylku na úrovni šablony zachytíte dřív, než se zhorší. Fungují i jiné monitorovací nástroje.

Prožeňte svou mapu stránek Screaming Frogem v režimu seznamu (list mode). Označte každou URL adresu, která nevrací 200, která má noindex, jejíž kanonická URL adresa ukazuje jinam, která je blokovaná v souboru robots.txt. Všechny je smažte.

Pak to těžší rozhodnutí. Podívejte se na šablony se slabým indexováním, které navíc nepřinášejí žádné imprese ani návštěvnost. To jsou vaši kandidáti na odstranění. Nepřesměrovávejte, nedávejte noindex. Jen za ně přestaňte ručit.

Znovu ten stejný vzorec

Stejný závěr jako všude jinde v technickém SEO. Žádný nový formát. Žádná zázračná značka. Jen URL adresy, které splňují základy, a obsah, který stojí za obhajobu.

Google byl se zlými mapami stránek trpělivý přes deset let. Weby se naučily, že můžou Googlu odeslat všechno a nechat ho, ať si to přebere. Ty časy končí. Celoplošná kvalita webu je dnes součástí základního hodnocení (core ranking). Každá URL adresa, kterou odešlete, do toho výpočtu vstupuje.

Vaše mapa stránek není seznam stránek, které existují. Je to seznam stránek, podle kterých jste ochotni nechat se posuzovat.

Odešlete seznam, který byste obhájili.

Martin Stepanek

Martin Štěpánek

Konzultant technického SEO a výkonu webu

S více než 10 lety zkušeností s tvorbou a optimalizací webů jsem se naučil, že technická kvalita je základem úspěchu. Pomáhám firmám maximalizovat potenciál jejich webu prostřednictvím technického SEO a optimalizace výkonu, které přinášejí lepší zkušenosti uživatelům a silnější výsledky firmám.

Newsletter

Technické SEO tipy každé dva týdny do vaší schránky

Získejte praktické strategie, které pomohou majitelům firem a vývojářům vytvářet výjimečné uživatelské zážitky, optimalizovat technické SEO a výkon, a zvyšovat tržby.

Newsletter je pouze v angličtině
    Mersudin ForbesMark Williams-CookAleyda Solis
    Doporučováno předními odborníky v oboru

    Žádný spam. Odhlásit se můžete kdykoli.

    Přihlášením souhlasím s Ochrana osobních údajů a Obchodní podmínky.

    Získejte bezplatné tipy o technickém SEO a výkonu webu

    Sledovat mě