Mencegah website anda terindex google atau mesin pencari lainnya dengan robots.txt

Karena sesuatu hal terkadang kita ingin agar website kita tidak terindex oleh google atau mesin pencari lainnya yaitu dengan membuat file robots.txt. Hal ini diperlukan misalnya ketika kita sedang dalam proses pembuatan website, atau karena ingin menyembunyikan folder/file tertentu agar orang lain tidak bisa menemukannya melalui mesin pencari.

Caranya anda buat file robots.txt di root folder website anda dan isi dengan command sesuai keinginan anda, sebagai contoh:
1. Command ini berfungsi untuk mencegah semua jenis bot (program) dari mesin pencari untuk mengindex semua file anda (root dan turunannya).

User-agent: *
Disallow: /

2. Command ini berarti mencegah semua jenis bot mesin pencari untuk mengindex semua file yang berada di folder administration

User-agent: *
Disallow: /administration/

3. Command ini berarti mencegah bot dari google ntuk mengindex semua file anda (root dan turunannya).

User-Agent: googlebot
Disallow: /

4. Command ini berarti mencegah bot dari google ntuk mengindex semua file gambar anda (root dan turunannya).

User-agent: Googlebot-Image
Disallow: /

5. Command ini berarti mencegah semua jenis bot mesin pencari kecuali google untuk mengindex semua file yang berada di folder root dan turunannya, bot dari google boleh mengindex kecuali untuk folder cgi-bin dan privatedir

User-agent: *
Disallow: /
User-agent: Googlebot
Disallow: /cgi-bin/
Disallow: /privatedir/

6. Command ini berarti mencegah semua jenis bot mesin pencari untuk mengindex semua file yang berada di folder root dan turunannya, tetapi utk bot alexa (ia_archiver) diperbolehkan, karena disallow nya dikosongkan yang fungsinya spt tombol on/off

User-agent: *
Disallow: /
User-agent: ia_archiver
Disallow:

Sebagai tambahan informasi, kita bisa menggunakan syntax allow untuk mengijinkan indexing, tapi tidak semua mesin pencari mengenali command tersebut, jadi sebaiknya gunakan disalow yang dikosongkan saja seperti contoh terakhir.

Dan ini ada contoh robots.txt untuk wordpress (copas dari diskusi di situs wordpress di sini)

User-agent: *
Disallow: /wp-admin
Disallow: /wp-includes
Disallow: /wp-content/plugins
Disallow: /wp-content/cache
Disallow: /wp-content/themes
Disallow: /wp-includes/js
Disallow: /trackback
Disallow: /category/*/*
Disallow: */trackback
Disallow: /*?*
Disallow: /*?
Disallow: /*~*
Disallow: /*~

Semoga bermanfaat.

work as freelancer - i’m a humanize human, a son, a father, a husband, who love coffee and cigarette, lazy and moody, entrepreneur, very easy to sleep, internet addict, bad designer, humorious, playing guitar, can’t singing & cooking, thin body, brown skin, smily, travelling & hiking, art & culture related, etc………

11 Comments

  1. Fadhly

    June 30, 2013 at 3:52 am

    Saya juga pernah melakukan hal ini.. 🙂

    • admin

      June 30, 2013 at 4:37 am

      utk apa klo blh tau mas fadhly?

  2. Ok Artikel

    October 6, 2014 at 11:14 pm

    Konten Adalah Raja Dan Backlink Adalah Ratu… Sebuah Blog Tidak Akan Pernah Bagus Jika Tidak Di Dukung Artikel Yang Berkualitas…

  3. tumbas

    October 12, 2014 at 1:18 pm

    Trima kasih mas, artikelnya sangat membantu buat web saya yang baru.

  4. yadi

    July 11, 2015 at 11:29 am

    terima kasih gan…

  5. Dani

    September 10, 2015 at 5:13 pm

    maaf gan mau tanya, ini apa artinya ?
    User-agent: Mediapartners-Google
    Disallow:

    User-agent: *
    Disallow: /search
    Allow: /

    • admin

      September 12, 2015 at 3:17 am

      utk yg
      User-agent: *
      Disallow: /search
      Allow: /

      semua bot ga blh masuk ke folder /search, ex: domainku.com/search
      utk yg
      User-agent: Mediapartners-Google
      Disallow:

      bot Mediapartners-Google (crawler utk adsense/iklan) boleh lihat semua folder
      tapi, klo dua2nya digabung itu berarti khusus bot Mediapartners-Google dia boleh masuk folder /search, sementara yg lainnya ga boleh lihat folder /search, kira2 gitu mas dani

  6. sungkono

    April 18, 2016 at 11:45 am

    wah sangat2 bermanfaat, jadi tahu dah,,,meskipun sedikit agak bingung..hihihihi

  7. Kizuki

    October 13, 2016 at 4:53 am

    Thanks gan sangat bermanfaat, ane coba dulu

  8. Shiromaru

    December 30, 2016 at 10:53 pm

    mau tanya ini artinya apa ya
    User-agent: *
    Disallow: /*

    krn saya mau buat agar domain.com/blabla kagak keindex tapi yg ke index domain.com/article/blabla … apa yg diatas sudah benar

    • admin

      January 1, 2017 at 3:43 pm

      sdh benar kok mas, itu artinya smua bot tdk mengindex apa2, mungkin yg blabla itu terindex krn sdh dibuat sblm robots.txt ada, jd keburu terindex, klo mau dihapus dr catatan google bisa dari cek pke webmaster toolsnya google, atau bisa jadi ada kemungkinan lainnya

Leave a Reply

Your email address will not be published. Required fields are marked *

Top