Robots.txt utk mengurangi trafic yang tidak diinginkan

March 11th, 2009

Disaat yang lain sibuk membuat tulisan tentang bagaimana meningkatkan traffic, saya malah kebingungan bagaimana untuk menurunkan traffic. Beberapa hari yang lalu di awal bulan maret 2009, blog saya mengalami lonjakan traffic yang saya nilai tidak wajar. Bandwidth yang terpakai sangat tinggi tetapi pengunjung blog relatif tetap, bahkan cenderung menurun. Kemudian saya bandingkan statistik antara awstats dan google analytics. Dan saya menarik kesimpulan bahwa traffic yang tinggi berasal dari robot spider mesin pencari.

Seperti yang kita ketahui, robot/spider/bot atau apalah namanya itu bertugas membaca isi dari blog atau website kita agar blog kita bisa terindex ke mesin pencari darimana robot tersebut berasal. Sebenarnya robot itu sangat membantu kita agar blog kita bisa masuk ke mesin pencari. Tetapi kalo kebanyakan robot sok tahu yang meng-crawl halaman website kita, padahal jatah bandwidth kita terbatas akan menjadi masalah.

Salah satu cara mengatasainya adalah dengan menggunakan robots.txt. Untuk lebih mengenal tentang robot.txt bisa membaca tentang robot.txt disini atau bisa juga baca FAQ-nya di FAQ Robot.TXT. Karena saya tidak paham dengan Robots.Txt maka saya membuat robots.txt menggunakan Robots.Txt Generator, dan hasilnya menjadi seperti ini robot.txt saya. Dan sekarang traffic blog saya kembali normal.

Tags: , , , , ,

81 Responses to “Robots.txt utk mengurangi trafic yang tidak diinginkan”

  1. rismaka says:

    Sama bro, bandwidth akhir2 ini boros semenjak pindah hosting. Tapi pngunjung ya segitu2 aja, ga nambah, kurang iya :(

    Eh, ikut ngopy robotnya yee..

  2. piyudh says:

    hihihihi…punya sayamalah saya cuekkin masalah kayak traffic..nggak pusingin masalah itu..hihihi…tapi buat share infonya…lumayanlah, buat bekal nanti..hiihihi..:p

    • Ardi says:

      Lha iya, kalo wordpress gratisan emang nggak bisa dimainin ataupun ditambahin robot.txt. Kalopun terjadi ledakan traffic ya yg bermasalah wordpress.com-nya, bukan kita…

  3. sof says:

    info yg bermanfaat sekali, thx

  4. p3ny0 says:

    wah.. saya masih bingung naikkan traffic, yg sini malah berusaha menghapus traffic… :D

    thanx infonya boss.. tuk jaga2 aja, ntar kalo terjadi lonjakan traffic yg ga wajar… :)

  5. Nauval says:

    Trafic blog saya malah anjlok nih…

  6. aribicara says:

    Saat orang sedang ngomongin yg ginian, aku kok tetap saja ga dong yach :)

    *Maap baru ngeblog sich :)

    Salam :)

    • Ardi says:

      Wah, kalo masalah ngeblog kayaknya duluan mas Ari deh. Lebih baru saya. Cuma mungkin bukan bidangnya atau mas Ari nggak fokus disitunya. Salam juga…

  7. Bongkeng says:

    mngkin nggak mas karena suatu plugin??
    bulan kemarin akun saya sempat di suspend sama hosting yg katanya membahayakan server karena tinggi nya trafict ke blog saya, bayangkan saja, UV cuma 50 tapi page impression ampe 5000 lebih, gw mikir dari mana datangnya tuh PI, lalu aku konfirm ke hosting nya dan katanya ada mugnkin pluginku yg bikin itu, lalu saya ilangkan plugin, kalau ga salah aku iseng pasang pingcrawl..

    OK deh, manfaat banget infonya, makasih.. nanti coba saya implementasikan :D (haiyah sok diplomatis ngomongnya kayak caleg saja.. hahaha)

    salam

    • Ardi says:

      Kayaknya nggak deh, Mas. Soalnya saya sudah lama nggak nambah plugin. Pingcrawl tu buat apa? Saya jarang nambah plugin kecuali kalo ada rekomendasi dari para ahli *kayak iklan sampo aja* :D
      Salam juga

  8. oskarzero says:

    maksih atas info nya mas
    salam knl ya

  9. sanjaya says:

    wah,saking banyaknya pengunjung mpe harus ngurangin pengunjung..keren..hehhehe

    kl tempatku tak kasih itu bisa 0 pengunjung perhari bahkan minus…
    hahahha

  10. heru says:

    hem, saya juga lagi menghemat bw nih.. mklum satu hostingan keroyokan berapa domain :P

  11. bangmarbun says:

    emang berpengaruh yah… trafic itu kita lihat dimana sih..

    makasih ya mas..dah berbagi sama kita2 yng newbie yang masih baru masuk ke dunia blogging

    • Ardi says:

      Bisa pake awstat atau pakai google analytics. Kalo awstat masuk ke cpanel kemudian pada bagian logs pilih awstats. Kalo pake google analytics harus punya akun google.
      Saya juga masih baru dalam dunia blogging kok bang…

  12. khafi says:

    wah beneran nih???
    waduh…

  13. @Nn!3 says:

    ga pernah mikirin robot.txt deh… soalnya masih pake blogspot jadi kalopun ada lonjakan trafik yang bermasalah paling si blogspotnya…

    tapi kayaknya cukup ngaruh buat yang trafiknya dibatasi

  14. Afif says:

    PageRank nya juga ikut turun….

    • Ardi says:

      Ya nggak pengaruh, selama robot google masih dipersilakan masuk untuk meng-crawl.
      Pagerank khan milik google, dan robot google tidak dilarang untuk crawl halaman kita.

      User-agent: Googlebot
      Disallow:
      User-agent: googlebot-image
      Disallow:
      User-agent: googlebot-mobile
      Disallow:
      
  15. Supermance says:

    baru tau nih tentang robot.txt, thx for sharing :)

  16. hanstoe says:

    bagus juga tuh….

  17. audy says:

    hehehe lom ngeh d masalah robot.txt karena traffic saya normal2 ajaah… serem juga kalo kebanyakan robot yang crawl…btw kok bisa tiba2 banyak robot yang crawl napa mas? apa habis submit2 ke directory ato napa? thanks yaaah..

    • Ardi says:

      Saya tidak tahu juga kenapa tiba-tiba banyak tamu tidak diundang (robot). Soalnya kayaknya optimasi saya biasa-biasa saja. submit dir, submit rss dll. Mungkin resikonya gitu kali. sekarang juga banyak spam di komentar semacam buy viagra, casino dll. nggak tau tu orang dapet darimana blog ini.

  18. suamimalas says:

    berarti selama ini yang banyak masuk bot-nya siapa?

  19. Freidrik says:

    Bos, kalau Googlebot DISALLOW, apakah nanti web kita jadi tidak bisa di halaman 1 google atau tidak dikanali lg ??

    Thanks

    • Ardi says:
      User-agent: Googlebot
      Disallow:
      

      Artinya google dipersilakan mengindex halaman kita, jadi kemungkinan bisa masuk halaman 1 (kalau SEO-nya bagus atau lagi beruntung)


      User-agent: Googlebot
      Disallow: /
      

      Artinya google tidak diperkenankan mengindex halaman kita. Secara teori halaman kita tidak akan ada di halaman google.

  20. salakberduri says:

    naiz inpo gan….
    saia masi berjuang naikin trafik….

    klo seting crawl di gugel webmaster dinaikin mpe mentok bisa bkin bw jebol g gan?

    • Ardi says:

      Kemungkinan bisa juga. Kalo sering update sie kayaknya malah bagus kalo setting crawl-nya dinaikin. tapi ya resiko mungkin BW-nya naik.

  21. salam kenal :)
    untung cepet ketauan kl ga lumayan tuh ngabis2in bandwith
    izin copy robot.txt nya mas

    makasih buat info & robot nya

  22. theodora says:

    aku masuk blog mu malah bukan karena tulisannya…tapi karena foto yang u pajang buat blogwalking kemana2,habisnya aku penasaran dengan fotomu itu mirip dengan kakakku yang hilang :=( tapi kayaknya tidak…. :( kakakku

  23. hendri says:

    good lesson.. thanks bro

  24. Postingnya menarik baget ni, saya suka banget, mudah2an bermanfaat..

    Salam kenal ya.
    Silahkan berkunjung ke BLOG HEBOH dan berkomentar ria ya, soalnya BLOG HEBOH make sistem Dofollow

    Oh iyah satu lagi gabung jadi pengikut saya yah..
    Di tunggu yah kedatangannya,.

  25. ebta says:

    Lama nggak masuk sini, eh setelah masuk ternyata belum di update artikelnya …
    btw lagi sibuk apa memangnya ?

    Oh ya, tuh pinjam fotonya siapa memang ? teknik untuk memperbanyak pengunjung ya ? hehe…

    • Ardi says:

      Iya mas. hehehe. sibuk nge-game :D
      Lagi mau rilis blog untuk komunitas sekolah. tapi masie dalam tahap pengembangan sambil nyoba-nyoba parking.
      Itu fotonya Putri Titian, Mas. hehehe, selama kampanye aja mungkin :D

  26. ABI says:

    Betul Di untuk menghemat bandwidth yg imbasnya hemat biaya:D

    • Ardi says:

      Iya, saya cuma belajar optimasi untuk semuanya, baik online maupun offline, penggunaan resource-bandwidth-optimasi page dll. Ngerjain jadi enak dan puas kalo semuanya bisa efektif.

  27. Diah says:

    Menarik sekali..saya baru tahu kalau robot.txt bisa menangkal traffik yg nggak wajar…makasih banget mas infonya :D

  28. kecrexz says:

    thenk kyuu bossssss

  29. wah, artikel yang sangat bagus neh.

    btw, boleh ga kalo saya cantumkan artikel di atas di website butik online kami?

    butiknya :
    http://www.bungkusan.com

    kalo boleh, tolong email saya yah ^^

  30. da yang punya invite chi.mp g? lo ada aku dikasih satu ya?

  31. infini3 says:

    Saya lihat link menuju sitemap dimasukkan ke dalam robots.txt. Apakah ini akan mempermudah crawler mengindeks blog kita? Memangnya apa akibatnya bila kita tidak memasukkan link menuju sitemap di dalam robots.txt? Btw kok harus yg *.xml.gz ya?

  32. cheuw says:

    ooh pantesan ..
    saya liat di statpress banyakan spidernya,
    dicoba dlu ya..

  33. cheuw says:

    pas dari generatornya
    default smua??
    g ada yg diganti?
    cuma nama site ny aja yg diganti ato gmn?

  34. ndrahawk says:

    Cuma mw diskusi aj…

    klo ga salah robot.txt itu digunakan untuk menghindari hacking melalui search engine terhadap folder dan file2 kita. klo search engine mengcrawl folder atau file2 penting kita bisa gawat tuh. Peluang dihack atau dicuri sangat besar. Jadi isi robot.txt gw set:
    User-agent:* //semua search engine
    Disallow:”folder2 yang ga boleh dicrawl oleh search engine apapun”

    Selain itu,file robot.txt gw jg diproteksi lewat file .htaccess biar ga ad yg tau folder atau file penting apa yg gw simpen di web hosting. Jadi web gw aman banged dari Google hacks. Coba lo cari file robot.txt dan .htaccess gw. Dijamin muncul ‘Not Found’.

    Klo masalah PR, blog gw msh jauh bgd sktr 20jutaan based on Alexa (hiks3..)cz gw lg jrang promosi n tulis artikel plus msh daun muda bgd. Sibuk soalnya. hehehe.

    Tp ini hnya pendapat gw semata,mungkin gw salah. So bales comment gw y!

    • Ardi says:

      Yupz, yang saya ketahui robots.txt memang digunakan untuk mencegah search engine dari apapun menangkap nama folder dan file yang kita lindungi di dalam blog kita.
      Saya juga sudah melihat ke blog Mas, dan melihat robots.txt mas. Tapi saya pernah baca tentang robots.txt (sumbernya lupa), robots.txt nya bisa disederhanakan menjadi :

      User-agent: *
      Disallow: /wp-

      Kalo robots.txt saya memang sengaja saya setting untuk search engine selain yang saya sebutkan tidak bisa mengcrawl.

      User-agent: *
      Disallow: / 

      CMIIW ya… ini juga hanya pendapat saya. :)

  35. klo mengedit robot.txt di blogger kayak gmana mas?

  36. Dwi says:

    wah mantab nich artikelnya bro, salam kenal

  37. Cara memasukkan robots.txt ke blog kita bagaimana yaa?

  38. lerry says:

    Boss tolong terjemahin apa arti robot.txt ini.

    User-agent: IRLbot
    Crawl-delay: 3600

    User-agent: *
    Disallow: /next/

    # har har
    User-agent: *
    Disallow: /activate/

    User-agent: *
    Disallow: /signup/

    User-agent: *
    Disallow: /related-tags.php

    User-agent: *
    Disallow:

    saya nanya lagi, emang kalo ada perubahan robot.txt di wordpress gratisan itu yang merubah dari wordpressnya ya? sebab kalo saya tidak salah robot.txt blog saya berubah, semenjak perubahan itu halaman yang biasa terindex di 5 besar di google sekarang 10 besar aja gak ada?

    salam kenal dan terimakasih banyak. ;)

    • Ardi says:

      Kalo yg paling atas nggak tahu, tapi kalo yg User-agent: * ke bawah itu artinya semua robot dilarang meng-crawl isi folder next, activate, signup dan file related-tags.php. Selain itu tidak masalah.
      Kalo yg saya tahu, walau halaman Anda sudah terindeks google dan menempati urutan pertama pencarian, kalo tidak dijaga dengan baik akan mudah terlempar dari hasil pencarian.
      salam kenal juga…

      • lerry says:

        wah online malam terus nih…..

        tanya lagi boleh ya? “cara menjaganya” agar tidak terlempar dari hasil pencarian bagaimana mas ardi ?

        ngomong2 tuh avatar foto ceweknya ya ;) cekep juga.

        • Ardi says:

          Kalo cara yang paling mudah menurut saya ya rajin-rajin posting dan blog walking. Dan kalo buat posting sedapat mungkin saling terkait satu dengan yang lain. Dan link yang ada dibuat senatural mungkin.
          Avatarnya cakep ya? hehehe, itu Gita Gutawa ;-)

  39. helep helep bagaimana cara mengecek halaman mana aja yang tak ditemukan

  40. charisma says:

    wah makasih ya..saya tadi sempat heran kok web site saya tiba tiba nggak bisa nggak bisa connect ke database dan user tidak bisa akses ke database…padahal biasanya bisa…jadi sekarang saya coba pelajari bentar mengenai robots.txt ini ..makasih ya..wassalammu’alaikum wr wb..

  41. Jo says:

    thx atas infonya

  42. LCD TV says:

    Hi, I can?t understand how to add your site in my rss reader. Can you Help me, please :)

  43. very nice post dude! great website… will be back soon!

Leave a Reply

Please copy the string UdRtrE to the field below: