Kamis, 28 Oktober 2010

Arti dan Fungsi Crawler

Crawler bertugas untuk mengindeks, membuat rangking, menyusun dan menata halaman dalam bentuk indeks terstruktur agar bisa dicari dalam waktu yang sangat cepat.

Obyek dari crawler adalah isi halaman, file, folder dan direktori web.
Sedangkan subyek dari robots.txt adalah mesin pencari/search engine crawler.
Crawler ini penting dipahami untuk SEO.

Crawler akan berhadapan dengan robotsg.txt yang akan memandu mesin pencari/search engine seperti google, yahoo dan bing untuk mengindeks sebuat blog atau website.

Sehingga crawler akan tahu mana halaman, folder atau file yang boleh diindeks atau tidak.
Semakin lengkap sebuah panduan dalam robots.txt akan lebih baik.
Dengan demikian robot crawler akan dengan cepat mengindeks isi website.

Kebanyakan halaman situs berisi link ke halaman lain.
Sebuah spider dapat memulai dari manapun.
Apabila ia melihat sebuah link kepada halaman lain, maka ia akan segera menuju ke sana dan mengambilnya.
Search engine seperti Alta vista mempunyai banyak spider yang bekerja secara pararel.

Sangat direkomendasikan untuk tidak menggunakan javascript pada menu utama.
Gunakanlah tag noscript.
Hal ini dikarenakan javascript tidak bisa diambil oleh spider untuk search engine.
Dan semua link yang mengandung javascript akan ditolak sebagai halaman teks.