Robot.txt Kullanımı
robots.txt dosyası web’i tarayan arama motoru robotlarının sitenize erişimini kısıtlar. Bu botlar otomatiktir ve bir sitenin sayfalarına erişmeden önce, belirli sayfalara erişmelerini önleyen bir robots.txt dosyası olup olmadığını kontrol ederler.
Sitenizde arama motorlarının dizine eklemesini istemediğiniz içerikler varsa, robots.txt dosyası kullanılmalıdır. Arama motorlarının sitenizdeki her şeyi dizine eklemesini istiyorsanız, robots.txt dosyasına ihtiyacınız yoktur.
Özetle; sayfanızın googlebot tarafından taranmasını robots.txt dosyası yardımıyla sınırlandırabilirsiniz.
“robots.txt” olarak adlandırılması gereken bu dosya sitenizin kök dizininde olmalıdır.
ROBOT.TXT DOSYASI OLUŞTURMA
En basit robots.txt dosyası iki kural kullanır:
User-agent: Aşağıdaki kuralın geçerli olduğu robot
Disallow: Engellemek istediğiniz URL
- Bu iki satır, dosyada tek bir giriş sayılır.
- İstediğiniz kadar giriş ekleyebilirsiniz.
- robots.txt dosyasındaki her bölüm ayrıdır.
- Tek girişe birden çok Disallow satırı ve birden çok user-agent ekleyebilirsiniz.
Örnek:
[html]
User-agent: *
Disallow: /klasor1/
User-Agent: googlebot
Disallow: /klasor2/
[/html]
ROBOTS META ETİKETİNİ KULLANIN
[html]<meta name="robots" content="noindex" />
[/html]
Yukarıdaki örnekte robots meta etiketi, arama sonuçlarında sayfayı göstermemeleri için tüm arama motorlarına bildirir.
“robots” direktifi tüm tarayıcılar için geçerli olduğunu belirtir.
Google’ın standart web tarayıcısı googlebot adıyla bilinir.
Sayfa taramasını sadece googlebot için, önleyecekseniz aşağıdaki etiketi kullanın:
[html]<meta name="googlebot" content="noindex" />
[/html]
DİREKTİF TALİMATLAR
[html]<meta name="robots" content="nofollow" />
<meta name="googlebot" content="noindex" />
[/html]
noindex: Arama sonuçlarında bu sayfayı gösterme ve arama sonuçlarında bir “önbellek” bağlantısı gösterme.
nofollow: Bu sayfadaki linkleri takip etme.
none: Eşdeğeri noindex, nofollow
NOT: Eğer sitenizde alt alan adı kullanıyorsanız ve bu dizinlerde belirli sayfaların taranmasını istemiyorsanız o alt alan adı için de ayrı robots.txt dosyası oluşturmanız gerekir.
Ayrıca hassas veya gizli bilginin robots.txt ile bloke edilmesi sizi tamamen rahatlatmasın. Eğer bu bağlantılar internette başka bir yerde referans olarak verilmişse (örneğin referans veren bloglarda), bloke ettiğiniz URL’ler arama sonuçlarında referans olarak görüntülenebilir.
Robot.txt kullanımı ile ilgili sunuyu indirmek için tıklayın