You are here: Home » Služby » Jak funguje vyhledávač

Jak funguje vyhledávač

Vyhledávače Google a Seznam jsou důležitým zdrojem návštěvnosti stránek. Miliony hledajících pojmů každý den. Jak ale vyhledávače fungují?

Získávání informací

Nejnáročnější fází je získat informace. Vyhledávače musí zmapovat internet a stáhnout ze stránwk všechno potřebné. Nejsou to jen texty, které potřebují. Aby pochopili o čem stránka vlastně je potřebují vědět co se na ní vlastně nachází a jak na ní odkazují ostatní stránky na internetu. Existují stovky takovýchto faktorů, které potřebuje vyhledávač posoudit.

O základní procházení se stará automatický skript – robot, který se nazývá crawler. Ten prochází jednu stránku za druhou a stahuje z ní potřebné informace a ukládá jí do databáze, kde je pak jiný robot projde a zpracuje. Crawler od Seznamu se jmenuje SeznamBot, crawler od Google zase GoogleBot. Identifikují se pomocí hlavičky prohlížeče, kterou pošlou serveru při návštěvě. Místo Mozzila, Opera anebo Internet Explorer se prostě představí svým jménem.

Crawleři se řídí instrukcemi pro roboty. Tato pravidla jim určíte v souboru robots.txt. Pokud například nechcete, aby neindexovali některou ze stránek, dá se jim to takto sdělit.

Přeštěte si   Jak poznat penalizovanou doménu

Nahromaděná data jsou postupně analyzována a tříděna. Krom textů se z nich vytváří i mapa internetu a určují další cíle pro crawlera.

Ačkoliv se roboti vyhledávačů chovají ke stránkám ohleduplně je dobré si ověřit zdali mají na stránku plný přístup. Ve výjimečných případech totiž aplikace anebo server může držet roboty na uzdě. Například v období silnějšího provozu anebo když je na server veden silný DdoS útok. U GoogleBota to lze snadno zjistit přes Nástroje pro webmastery u SeznamBota to nepoznáte.

GoogleBota lze na stránky nalákat tím, že do Nástroje pro webmastery nahrajete Sitemap.xml. Návštěva je pak v řádech desítek minut a indexace následuje většinou do druhého dne.

SeznamBota je nejlépe pozvat přes formulář pro přidání stránky. Ovšem kdy bude stránka zařazena do indexu záleží na vytíženosti dalších robotů na Seznamu. Pokud probíhá nějaká velká reindexace mohou to být i dny.

Přeštěte si   Spamcop

Zařazení do indexu

Pokud jsou data zanalyzována a zpracována nastal čas zařazení do indexu. V případě, že stránka neporušuje pravidla pro zařazení (například se na ní nenachází nevhodný obsah), lze jí dohledat přes operátor site:domena.tld.

Jestliže je stránka úplně nová přistupují k ní vyhledávače trochu jinak. Mluvíme často o pojmu fresh index. Daleko častěji se zobrazuje na lepších místech na témata spojená s aktuálními událostmi. Čím více na ní vznikají v krátkém horizontu odkazy na dalších nových stránkách, tím více se posouvá na lepší pozice. Jak dlouhou vydrží ve fresh indexu není známo. Většinou to je maximálně do tří týdnů.

Po fresh indexu jí čeká permanentní zařazení. Získá nějaké své místo na různá klíčová slova. To se postupem času mění v závislosti na další konkurenci.

Pozice ve vyhledávačích

Samotné pozice jsou ovlivněny stovkami faktorů, které na ně mají vliv. Jejich váha se přitom mění. Někdy manuálně úpravami algoritmu, jindy automaticky v důsledku aktuálních trendů. Nemá cenu se tím moc výkyvy pozic zabývat, pokud se nejedná o masivní propad, který může ukazovat na nějaký větší problém.

Přeštěte si   Problémy s Infinite scroll

Základem dobrých pozic je preference klíčového slova. Pokud chcete na něj být vidět v top pozicích, musí se na stránce nacházet. Články o daném klíčovém slovu jej mají nejen v textu, ale i nadpisech. Jestli jej na stránku nedáte anebo se o něm zmíníte jen na začátku textu, tak mu vyhledávače moc váhy nepředělí. Obor, který se zabývá optimalizací stránky a klíčových slov na ní se nazývá on page optimalizace.

Mimo samotné stránky má vliv i na pozice okolí. Nejvýznamnější jsou odkazy vedoucí na stránku. Ty ukazují jak je stránka na internetu autoritativní. Citace s odkazy z významných stránek mají větší vliv než náhodné zmínky někde v komentářích. Obor, který se věnuje budování odkazů se nazývá linkbuilding.

Všechny tyto faktory ve finále ovlivňují pozice ve vyhledávačích. Obor, který se jimi zabývá je SEO.

Share Button

Programuju v PHP už několik let spíše pro zábavu. Baví mě WordPress, protože tak lenivým lidem jako jsem já ušetří spoustu času. A rád sbírám reklamní flash disky. Tento blog používám pro utřídění myšlenek.

http://n-host.cz

Napsat komentář

Vaše emailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *