Již více než rok se převážně zahraniční zdroje zmiňují, že Google Search Console (dříve Webmaster Tools) hlásí nepochopitelné chyby typu 404 v přesměrování stránek. Také v Čechách se občas vyskytne někdo, kdo podobný problém zaznamená. Většinou však nebudete mít tušení, co jste udělali špatně.
Kde tuto chybu hledat?
V případě, že pravidelně kontrolujete stav svého webu přes Search Console, jistě víte, že chyby 404 a jim podobné se nachází v menu Procházení – Chyby procházení. Pokud zde objevíte chybnou adresu označenou jako /mobile nebo /m, nezoufejte.
Zde je důležité zmínit, abyste pravidelně kontrolovali Chyby v adresách URL nejen v záložce Počítač, ale také v záložce Chytrý telefon, kde se právě tento specifický problém projevuje. Jedná se totiž o responzivní verzi stránek, kterou Googlebot hledá.
Existuje daný adresář?
Pokud se vám toto stane a jste si jisti, že takový adresář na hostingu jednoduše není, můžete zůstat v klidu. Po rozkliknutí dané URL uvidíte Podrobnosti o chybě a problémovou URL ve tvaru např. https://www.wplama.cz/mobile/, případně https://www.wplama.cz/m/.
To bude následováno standardní hláškou:
„Googlebot tuto adresu URL nemohl procházet, protože odkazuje na neexistující stránku. Chyby 404 obvykle nemají nepříznivý vliv na výkon stránek ve vyhledávání. Můžete je však využít ke zlepšení uživatelského dojmu.“
V záložce „Odkazováno z“ s nejvyšší pravděpodobností naleznete domovskou stránku svého webu.
Nyní je nezbytné se ujistit, že na domovské stránce se opravdu nenachází žádný odkaz, který by obsahoval /mobile nebo /m.
Také bychom měli zkontrolovat všechny soubory Sitemap – to hlavně v případě, že chyba viditelně nevzniká odkazem z hlavní stránky webu.
Pokud je vše zkontrolováno, odkaz neexistuje a přesto v Search Console vidíte chybu 404 přesně tohoto znění, můžete si být jisti, že se jedná o chybu Google. Přesněji řečeno nelze o chybu, ale o chybný předpoklad.
Google u responzivních verzí webu automaticky předpokládá, že existují ve vlastní složce. Ta je vývojáři nejčastěji označována /mobile nebo /m. Z podstaty problému může být řešení poměrně složité. Zvláště, pokud chcete do hloubky řešit předávání hodnot jednotlivých odkazů a algoritmy Google, které nikdo nezná.
Jak se problému zbavit?
Vzhledem k tomu, že v tomto případě může docházet maximálně ke dvěma chybám 404, není zapotřebí dlouhého bádání. Jednoduše ve svém pluginu Redirection přidejte přesměrování 301 (přemístěno natrvalo) vedoucí přímo zpět na homepage daných stránek.
Následně pouze otestujte, zda přesměrování funguje správně a vrací na domovskou stránku.
Pozor: Pokud narazíte na podobně vypadající chybu, která neodpovídá tomuto popisu, doporučujeme postup probrat s vaším SEO konzultantem.
No, takhle to zní hezky jednoduše, ale mně se teď u jednoho webu děje to, že si nějací roboti skládají adresy náhodně podle struktury webu a snaží se asi dostat do administrace (kterou mám v neobvyklém adresáři a žádný odkaz na ni nevede). Např. mám stránku http://www.example.com/herci/vaclav, ale v přístupech se mi objevuje http://www.example.com/marie/herci nebo klidně http://www.example.com/vaclav/marie, či http://www.example.com/repertoar/herci. Prostě si to prolezlo celej web a všechny odkazy si to rozložilo na jednotlivý části mezi lomítkama a skládá to náhodně dohromady…
Tohle se prostě nijak ošetřit nedá, přitom mi to dělá víc jak polovinu trafiku…
Toto není úplně neobvyklý jev a myslím, že jste na správné stopě s myšlenkou, že se mohou snažit najít administraci. Je dobré si také uvědomit, že Google a Seznam nejsou jediné vyhledávače na světě, co mají vlastní crawler. Zkoušení různých adresářů odpovídá spíše snaze indexovat všemožné varianty, které by se mohly vyskytnout například v eshopu na základě filtru (pokud používají kombinace adresářů, které existují). Ideální by bylo zjistit, z jakého zdroje tito roboti pochází a odkud na vás přišli (nějaké staré a nekontrolované odkazy z link farem?).
Díval jsem se jen na pár desítek přístupů a každý byl z jiné IP bez refereru, takže se přikláním spíš k variantě hledání administrace, než indexování různých variant. Jediné co s tím, je asi počkat, až ho to přestane bavit… Jinak nevím…
Být to na mně, udělal bych následující:
1) zkontrolovat, zda se tam vyskytují duplicity, které by mohly vést na potenciální uživatele a ošetřit je přesměrováním;
2) vyčistit si analytics od tohoto spamu, aby mi tam do budoucna nezůstávala hromada nepoužitelných dat, nepochopitelné návštěvy a vysoká bounce rate;
Více mě aktuálně nenapadá. Bylo by dobré to probrat s konzultantem a zkontrolovat, jaké jsou možnosti filtrování u providera. Zde je také možné některé věci odbourat pomocí dostupných blacklistů apod.