Open AI Luncurkan GPTBot Sebagai Web Crawler
Sebagai platform penyedia informasi berbasis AI, ChatGPT menggunakan website crawler untuk menampilkan hasil. Baca tentang bot ini dan cara membatasinya di sini.
Dipublikasikan Aug 23, 2023 10:08
Terakhir diperbarui pada Aug 23, 2023 10:08 oleh Siti Nuradilla
Pokok Bahasan
-
OpenAI memperkenalkan website crawler-nya yang disebut sebagai GPTBot.
-
Website crawler ini berfungsi untuk menyelami internet dan mengumpulkan informasi yang akan ditampilkan di ChatGPT.
-
Webmaster dapat mencegah bot ini untuk mengunjungi situs mereka dengan perintah disallow di dalam file robots.txt.
-
Google sedang mencari alternatif pelengkap robot.txt untuk mengantisipasi web crawler AI ini.
Pada awal bulan ini, Open AI sebagai platform penyedia ChatGPT telah meluncurkan web crawler yang disebut sebagai GPTBot untuk mengakses informasi di internet dan menyediakannya di platform mereka. Bagaimana tanggapan mesin telusur dan bagaimana cara membatasi crawler tersebut untuk mengakses konten kita? Temukan jawabannya di bawah ini.
Apa itu GPTBot?
Dalam langkah untuk memajukan teknologi kecerdasan buatan (AI), OpenAI telah memperkenalkan GPTBot, sebuah web crawler canggih yang dirancang untuk meningkatkan kemampuan model AI seperti GPT-4 dan GPT-5 yang sangat dinanti.
GPTBot berperan penting dalam pengembangan AI. Web crawler ini dapat diidentifikasi dengan token agen pengguna unik "GPTBot" dan string agen pengguna sebagai berikut:
Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; GPTBot/1.0; +https://openai.com/gptbot)
Fungsi dan Batasan GPTBot
Pada dokumentasi OpenAI, GPTBot akan digunakan dengan cermat untuk memindai dan mengumpulkan data dari halaman web, dengan janji untuk berkontribusi pada kemajuan model AI yang akan datang.
Mereka juga memastikan kualitas dan etika sumber data dengan proses penyaringan yang ketat. Misalnya, pada sumber web yang mengharuskan pembayaran dan melibatkan pengumpulan informasi yang dapat diidentifikasi secara pribadi atau personally identifiable information (PII), maupun teks yang melanggar kebijakan yang telah ditetapkan, secara sistematis akan disaring.
Cara Mengontrol Interaksi GPTBot pada Website
Melalui forum diskusi webmaster world, banyak dari webmaster telah menemukan kunjungan GPTBot pada website mereka dengan frekuensi yang tinggi. Hal ini membuat mereka lebih waspada dan melakukan beberapa hal seperti disallow robot tersebut.
Jika Anda merasa robot AI ini tidak seharusnya mengumpulkan informasi dari situs Anda, maka berikut adalah cara membatasinya.
Implementasikan direktif tertentu dalam file robots.txt situs. Jika Anda ingin sepenuhnya melarang GPTBot mengakses bagian apa pun dari situs Anda, sertakan perintah:
User-agent: GPTBot
Disallow: /
Dengan menambahkan perintah di atas, Anda secara efektif telah memberitahu GPTBot untuk tidak merayapi bagian mana pun dari situs Anda.
Namun, jika Anda ingin memberikan akses tertentu kepada GPTBot pada bagian-bagian tertentu dari situs, Anda dapat menerapkan perintah sebagai berikut:
User-agent: GPTBot
Allow: /directory-1/
Disallow: /directory-2/
Dalam skenario ini, GPTBot diizinkan untuk mengakses konten dalam "direktori-1," namun secara eksplisit dilarang merayapi "direktori-2." Kontrol ini memungkinkan Anda untuk menyesuaikan akses GPTBot dengan preferensi dan prioritas situs web.
Tanggapan Mesin Telusur
Sebagai tanggapan dari gerakan OpenAI, Google tampaknya sedang mempertimbangkan alternatif lain untuk mencegah crawler GPTBot yang dapat merugikan. Dalam blognya, Google mengumumkan niatnya untuk mengembangkan protokol pelengkap robots.txt yang telah digunakan selama lebih dari tiga dekade. Motivasi di balik langkah ini adalah berkembangnya teknologi AI baru, bukan hanya dari Google tetapi juga dari pemain industri lainnya.
Pengembangan ini menyusul laporan tentang OpenAI yang memanfaatkan konten internet untuk layanan ChatGPT-nya. Perlu dicatat bahwa pengumuman ini belum final. Pernyataan Google lebih menekankan komitmennya untuk terlibat dalam diskusi dan kolaborasi dengan komunitas online.
Dalam pernyataan yang dirilis di Twitter, Google menyatakan:
“Hari ini, kami memulai diskusi publik, mengundang anggota komunitas web dan AI untuk memberikan pendapat tentang pendekatan terhadap protokol pelengkap. Kami ingin melibatkan berbagai suara dari berbagai penerbit web, masyarakat sipil, akademisi, dan bidang lainnya dari seluruh dunia untuk bergabung dalam diskusi ini, dan kami akan mengumpulkan mereka yang tertarik untuk berpartisipasi dalam beberapa bulan mendatang."
Demikian ulasan GPTBot yang saat ini sudah berjalan dan bagaimana Anda dapat membatasi interaksinya dalam situs Anda.
Sumber Artikel
Sebagai penyedia berita yang berdedikasi, kami berkomitmen terhadap akurasi dan keandalan. Kami bekerja ekstra dengan melampirkan sumber yang kredibel untuk mendukung data dan informasi yang kami sajikan.
- Dokumentasi OpenAI: https://platform.openai.com/docs/gptbot
- Blog Google: https://blog.google/technology/ai/ai-web-publisher-controls-sign-up/
- Google Search Liaison Twitter: https://twitter.com/searchliaison/status/1677055071274795009
- Forum diskusi Webmaster World: https://www.webmasterworld.com/search_engine_spiders/5091131.htm
Tati Khumairoh
An experienced content writer who is eager in creating engaging and impactful written pieces across various industries. Using SEO approach to deliver high-quality content that captivates readers.
Tulisan lainnya dari Tati
cmlabs Luncurkan Panduan Penulisan untuk Target Global
Tue 18 Jun 2024, 08:57am GMT + 7Google Tambahkan Product Variant pada Data Terstrukturnya
Wed 28 Feb 2024, 08:32am GMT + 7Google Luncurkan Serangkain Fitur Baru di Wilayah EEA
Tue 20 Feb 2024, 08:23am GMT + 7Google Melakukan Rebrand Bard menjadi Gemini
Tue 20 Feb 2024, 08:15am GMT + 7Update berita SEO dari seluruh dunia di cmlabs News untuk wawasan SEO sehari-hari Anda
Dalam pengembangan mesin telusur terbarunya, Bing menggandeng GPT-4 untuk menyajikan pengalaman pencarian termaju. Ini lengkapnya
Bard, layanan AI percakapan eksperimental, menggabungkan informasi dengan kecerdasan model bahasa. Simak informasinya di sini
Dengan maraknya teknologi AI, search engine besar seperti Google dan Bing kini dilengkapi dengan generative AI masing-masing. Ini informasinya.
TULISKAN KOMENTAR ANDA
Anda harus masuk untuk berkomentar
Semua komentar (0)
Diurutkan Berdasarkan