Google nedávno upravil dokumentaci k tomu, jak velké soubory je schopen Googlebot při procházení webu zpracovat. Nejde o změnu chování crawleru, ale o upřesnění dokumentace, které však vyvolalo v SEO komunitě řadu otázek.
Podívejme se, co se vlastně změnilo a jaký to má dopad na technické SEO.
Jaký je aktuální limit velikosti HTML stránky
Podle aktualizované dokumentace Google platí pro Google Search následující limit:
- 2 MB pro HTML a další textové soubory
- 64 MB pro PDF soubory
To znamená, že Googlebot při procházení bere v úvahu pouze prvních 2 MB HTML dokumentu. Obsah, který je v kódu stránky až za tímto limitem, nemusí být při indexaci zpracován.
Je ale důležité dodat, že tento limit se týká jednotlivých souborů, nikoli celé stránky včetně všech zdrojů.
Například:
- HTML: 1 MB
- CSS: 1,5 MB
- JavaScript: 1,5 MB
Taková stránka je pro Googlebot stále v pořádku, protože limit se nesčítá napříč soubory.
Proč Google dokumentaci upravil
Google změnu popisuje pouze jako upřesnění dokumentace, nikoli jako novou technickou změnu crawleru.
Zároveň oddělil:
- obecné limity crawling infrastruktury Google
- limity specifické pro Google Search
V obecné dokumentaci je například uveden výchozí limit 15 MB pro crawling infrastrukturu, zatímco stránka věnovaná Googlebotu nyní jasně uvádí 2 MB limit pro HTML při procházení pro účely vyhledávání.
Jaký to má dopad na SEO
Ve většině případů nebude mít tato informace zásadní dopad. Typické HTML stránky mají totiž výrazně menší velikost.
Přesto existují situace, kdy může být limit problém.
- Velmi dlouhé stránky
Pokud je klíčový obsah až hluboko v HTML, může se stát, že ho Googlebot vůbec neuvidí.
Například:
- rozsáhlé landing pages
- velké produktové katalogy
- stránky generované šablonami s velkým množstvím kódu
2. Nadbytečný kód
Velký HTML soubor často vzniká kvůli:
- nadměrnému inline CSS
- zbytečným skriptům
- velkým JavaScript frameworkům
- špatně optimalizovaným šablonám CMS
To může nejen zvětšovat HTML, ale také zhoršovat crawl efektivitu.
- Špatná struktura obsahu
Důležité prvky stránky by měly být v HTML co nejdříve, například:
- hlavní obsah
- interní odkazy
- navigace
- strukturovaná data
Pokud jsou až na konci HTML dokumentu, Googlebot je nemusí zpracovat.
Doporučení pro SEO praxi
Pokud chcete mít jistotu, že limit velikosti HTML není problém, doporučuje se:
-
Kontrolovat velikost HTML stránky
Například pomocí:
- Screaming Frog
- DevTools v prohlížeči (Network → Document)
- Google Search Console – kontrola URL
-
Minimalizovat HTML
- odstranit zbytečné skripty
- omezit inline CSS
- optimalizovat šablony CMS
-
Umístit důležitý obsah co nejvýše v HTML
To pomáhá nejen crawlerům, ale i výkonu stránky.
Jak může pomoci Collabim při identifikaci problémových stránek
I když Collabim přímo neměří velikost HTML souboru, může velmi dobře pomoci odhalit stránky, kde by limit 2 MB mohl být problém.
Analýza URL a struktury webu
Analýza URL v Collabimu je nástroj, který ti poskytuje komplexní přehled o stavu tvých webových stránek z hlediska SEO a indexace. Neříká přímo, kolik HTML Googlebot zpracuje, ale pomáhá odhalit stránky, které mohou být problémové
V analýze URL lze identifikovat:
- velmi dlouhé landing pages
- stránky s velkým množstvím obsahu
- URL s velkým počtem interních odkazů
Tyto stránky bývají často generované šablonami nebo obsahují velké množství kódu, což může vést k nadměrné velikosti HTML.
Technická analýza stránky
Díky datům z Collabimu můžete rychle určit:
- které stránky mají největší SEO hodnotu
- které generují nejvíce klíčových slov
- které stojí za technickou optimalizaci jako první
Místo kontrolování stovek URL tak můžete začít u těch, které mají pro SEO největší dopad.
FQA
Jak poznám problémovou stránku pro crawling?
Sledujte hlavně:
- vysokou Page size
- vysoký počet odchozích odkazů (Out links count)
- pomalý Load time
- chybové status codes (404, 500 apod.)
Měří Collabim přímo velikost HTML pro Googlebot?
Ne, Collabim přímo nehlídá limit 2 MB HTML. Ukazuje ale Page size a další technické parametry, díky nimž snadno identifikuješ stránky s potenciálně velkým HTML nebo složitou strukturou.
Shrnutí
Upřesnění dokumentace Google přineslo jasnější informaci o tom, kolik HTML Googlebot skutečně zpracuje při procházení stránky.
Pro většinu webů to není problém. Přesto je to dobrá připomínka, že čistý a efektivní HTML kód je stále důležitou součástí technického SEO.
Zdroje
https://www.webmium.cz/blog/novinky-z-onlajnu-unor-2026/ komentáře SEO expertů (např. Pavel Ungr)
Search Engine Journal – Google clarifies HTML size limit for Googlebot https://developers.google.com/search/docs/crawling-indexing

