Robots.txt on tiedosto, jonka avulla voidaan antaa hakukoneiden roboteille erityisiä ohjeita miten sivustoa halutaan indeksoitavan. Erityisesti voit estää tiettyjen sivujen näkymisen hakukoneissa.

 

Yleisimmät Robots.txt tiedot

Estä hakukoneita indeksoimasta kaikki nettisivun sisältö

User-agent: *
Disallow: /

Estä tiettyä hakukonetta indeksoimasta tiettyä kansiota

User-agent: Googlebot
Disallow: /kansion-nimi/

Estä tiettyä hakukonetta indeksoimasta tiettyä sivua

User-agent: Googlebot
Disallow: /kansions-nimi/sivun-nimi.html

Sivukartta parametri

User-agent: *
Disallow:
Sitemap: http://www.sinunyritys.fi/sivukartta.xml

 

Mistä Robots.txt löytyy?

Tiedosto tulee aina lisätä palvelimen ylimpään hakemistoon. Eli tiedosto löytyy kirjoittamalla ”robots.txt” domainpäätteen loppuun. Esimerkiksi http://hakukonemaailma.com/robots.txt

Kommentit

Kommenttia