Mengenal file robots.txt, apakah perlu kita mengenalnya? bukan saja perlu untuk mengenalnya, tapi wajib untuk kita kenal baik dengan file yang satu ini, file robots.txt adalah suatu file teks yang digunakan untuk memberitahukan pada mesin robotnya google untuk daerah mana saja yang boleh dan tidak boleh diindex atau dikunjungi oleh robotnya google,tentunya untuk konsumsi publik! file robots.txt sendiri terletak diroot direktori.
- fungsi dan kegunaan robots.txt
Dapat kita gunakan untuk proteksi webserver kita, file robots.txt bisa kita jadikan alternatif untuk memproteksi webserver kita dari serangan google hacking, saya sudah jelaskan diatas dengan kita menggunakan file ini kita bisa mengatur sendiri area mana saja yang boleh dikunjungi robot pencarinya google. - Menghemat bandwith webserver kita
kita tahu bahwa mesin pencari robot google akan mengindex semua file ataupun direktori webserver kita walaupun file dan direktori itu kosong, tentu saja ini akan meningkatkan bandwith webserver kita, dengan adanya file ini maka kita bisa mengatur daerah mana saja yang boleh dan tidak boleh diakses atau dilihat oleh mesin robotnya google. dan juga mesin pencarinya robot google ini memiliki batasan waktu untuk mengunjungi suatu web, makanya kenapa mesin pencariya google lebih suka dengan web/blog yang sederhana dan simple
Contoh file robots.txt
# BEGIN XML-SITEMAP-PLUGIN
Sitemap: http://localhost/wordpress/sitemap.xml.gz
# END XML-SITEMAP-PLUGIN
User-agent: *
Disallow: /cgi-bin
Disallow: /wp-admin
Disallow: /wp-includes
Disallow: /wp-content/plugins
Disallow: /wp-content/cache
Disallow: /wp-content/themes
Disallow: /trackback
Disallow: /comments
Allow: /wp-content/uploads# Google Image
User-agent: Googlebot-Image
Disallow:
Allow: /*# Google AdSense
User-agent: Mediapartners-Google*
Disallow:
Allow: /*
Dan ini contoh dari beberapa user-agent / bot dari mesin pencari :
User-Agent Mesin Pencari
googlebot Google
msnbot MSN
yahoo-slurp Yahoo
teoma Ask / Teoma
gigabot GigaBlast
scrubby Scrub The Web
robozilla Dmoz Checker
nutch Nutch
ia_archiever Alexa /Wayback
baiduspider Baidu
googlebot-image Google Image
yahoo-mmcrawler Yahoo MM
psbot MSN pic search
asterias singing fish
yahoo-blogs/v3.9 Yahoo Blogs
Dari penjelasan fungsi robots.txt apakah kalian tidak juga mau berkenalan baik dengan file robots.txt…:-)










