Lighthouse před pár týdny vydal nový agentický audit. Jedna z věcí, které kontroluje, je, jestli máte soubor llms.txt.
Ve stejném měsíci Google ve vlastních doporučeních k AI vyhledávání zařadil llms.txt mezi věci, které nemusíte řešit.
Jedna firma. Říká vám, ať soubor vytvoříte, i ať si s ním neděláte hlavu. V jednom měsíci. Není divu, že je z toho každý zmatený.
Zmatek se rozplyne ve chvíli, kdy přestanete llms.txt považovat za nástroj pro vyhledávání. Nikdy nástrojem pro vyhledávání nebyl.
Tady je můj závěr. Google ani AI vyhledávání nikdy nebudou llms.txt používat k hodnocení ani citacím. Ani teď, ani později.
Agentické nástroje ale mají reálný důvod číst ho už dnes. Pokud soubor vytvoříte s očekáváním, že bude zajímat první skupinu, vytvořili jste ho pro špatné publikum.
Proč ho Google nikdy nepoužije k vyhledávání
Dva důvody. Oba jsou zakořeněné v tom, jak vyhledávání funguje.
Zaprvé, je to nejsnazší nástroj na cloaking za poslední roky.
llms.txt je samostatný soubor, který máte plně pod kontrolou. Leží vedle HTML, které vidí skuteční uživatelé. Nic vám nebrání napsat pro stroj vyladěnou verzi nacpanou klíčovými slovy a lidem servírovat něco úplně jiného.
To je cloaking se syntaxí markdownu.
Google se dvě desetiletí učil nedůvěřovat ničemu, co mu majitel webu předá přímo. Soubor jako tenhle by se dal zneužít během týdne.
Zadruhé, i kdyby ho Google chtěl použít, stejně by si každé tvrzení musel ověřit proti živé stránce.
Ve chvíli, kdy llms.txt porovnáváte se skutečným HTML, vám soubor nepřinesl nic. Je to jedno stažení navíc, jedno parsování navíc, jedna infrastruktura navíc napříč miliardami stránek. To všechno kvůli tvrzení, které si stejně znovu ověříte proti zdroji, který jste už prošli.
Nikdo nebude zatěžovat procházení nákladným krokem navíc jen proto, aby četl soubor, kterému stejně nemůže věřit.
Nemusíte mi věřit. Crawlery, o kterých byste si nejvíc přáli, aby ho četly, jsou přesně ty, které ho ignorují.
Googlebot ani Bingbot ho nepoužívají k hodnocení, AI odpovědím ani k ničemu jinému. AI crawlery, o kterých byste doufali, že se o něj opřou – GPTBot, ClaudeBot, PerplexityBot – si ho vyžádají jen zřídka, většinou vůbec.
Prohledejte si serverové logy na llms.txt a přesvědčte se sami. Crawlery, o kterých si přejete, aby jim na něm záleželo, o něj nestojí.
Tímhle souborem AI vyhledávání nevyhrajete.
Pro koho je vlastně určený
Pro agentické nástroje. To, k čemu byl navržen od prvního dne.
Claude Code, Codex, Cursor, Windsurf, Antigravity. Ani jeden z nich za sebou nemá index jako Google či Bing.
Nasměrujte kterýkoli z nich na web, který nezná, a musí si strukturu zjistit za běhu. Parsovat HTML plné navigace, reklam a JavaScriptu. Utrácet na to tokeny. V polovině případů uchopí špatnou sekci nebo špatně přečte rozložení.
Čistý llms.txt podá nástroji mapu. Tady je, co existuje, tady je, kde to leží, tady je čistá markdownová verze.
Šetří čas i tokeny. Omezuje chyby při parsování, které vznikají ze čtení nepřehledného HTML. To je celá jeho hodnota – a je reálná.
Nejjasnějším případem je API
Pokud provozujete API, právě tady si llms.txt své místo zaslouží nejjasněji.
Zveřejněte ručně sestavený seznam svých endpointů a referenční dokumentace. Nástroj se tak dozví, co vaše API dělá, a načte jen tu stránku, kterou potřebuje, místo aby kvůli jejímu nalezení seškrábal celý váš web.
Claude Code zná vaše endpointy okamžitě. Neprohrabuje se dvanácti stránkami marketingového textu, než se dostane k dokumentaci k autentizaci.
Tohle není teorie. Velké dokumentační weby, na které vývojáři tyto nástroje směrují, to už dělají.
Udržují llms.txt pro vlastní vývojářskou dokumentaci, protože jejich uživatelé tyto soubory celý den podsouvají kódovacím agentům. To je soubor používaný přesně tak, jak byl navržen. Agent čte dokumentační web, aby vykonal úkol – ne vyhledávací crawler čte ten váš, aby vás ohodnotil.
Je to nejjasnější příklad, ne však jediný. Z mapy může těžit každý web, který agent musí číst a procházet. Dokumentace a API jsou jen místa, kde je dnes přínos zřejmý.
Pro většinu webů llms-full.txt přeskočte
llms-full.txt spojuje celou vaši dokumentaci do jednoho obřího markdownového výpisu.
To dává smysl u produktu bohatého na dokumentaci nebo API, kde agentovi prospěje, když naráz pohltí všechno a celé se to vejde do kontextového okna.
U běžného webu je to zátěž na údržbu a riziko duplicitního obsahu. Pokud servírujete plnotextovou verzi, která se odchýlí od vašeho HTML, jste zpátky u problému s cloakingem.
Pokud vaše dokumentace k API není obrovská, llms-full.txt se může vyplatit. Pokud jste běžný web bez vývojářského publika, nevidím v tom smysl.
Jak k tomu přistoupit
Pokud máte vývojářskou dokumentaci nebo API, nasaďte pečlivě sestavený llms.txt:
- Udržujte ho malý – výrazně pod 50 KB.
- Vybírejte, co do něj patří – neházejte do něj celou mapu stránek.
- Udržujte ho přesný a aktualizovaný.
- Přidejte hlavičku
noindex, aby se soubor sám neumísťoval ve vyhledávání. - Vracejte ho čistě – jediné, co audit v Lighthouse penalizuje, je rozbitá odpověď. Chybějící soubor se čte prostě jako nerelevantní.
Čím dál je váš web od dokumentace a API, tím slabší je důvod. Prezentační web, který žádný agent neprochází, ho nepotřebuje.
Tohle ale není jen pro vývojáře. Pokud agenti musí číst váš obsah a jednat na jeho základě, čistá mapa pořád pomáhá.
Znovu ten samý vzorec
Stejný závěr jako všude jinde v technickém SEO právě teď. Žádný zázračný soubor nepřiměje Google, aby vám víc důvěřoval. Žádný textový soubor vám nevyhraje AI citace.
Práci odvedou základy. Soubor, který jste o sobě napsali sami, je nikdy neměl nahradit.
llms.txt je v pohodě. Je levný, není těžký a pomáhá nástrojům, které potřebují mapu.
Jen ho vytvořte pro agenta, který čte váš web, ne pro vyhledávač, který ho nikdy číst neměl.