Kecerdasan Buatan

Open AI Luncurkan GPTBot Sebagai Web Crawler

Dipublikasikan Aug 23, 2023, 10:56

Dipublikasikan Sep 20, 2023, 08:42 Oleh Tati Khumairoh

Dibagikan 27 kali

Disclaimer: Kami menawarkan konten berita organik dan bebas iklan kepada para pembaca kami.

Open AI Luncurkan GPTBot Sebagai Web Crawler

Platform AI, Chat GPT tidak serta merta menampilkan hasil. Mereka mengambil informasi dari internet untuk menyajikan jqwaban pada pengguna. Baru-baru ini, mereka mengumumkan kehadiran web crawler gptbot yang dapat mengunjungi website mana saja yang tersedia di internet.

Sebagai platform penyedia informasi berbasis AI, ChatGPT menggunakan website crawler untuk menampilkan hasil. Baca tentang bot ini dan cara membatasinya di sini.

Pokok Bahasan

OpenAI memperkenalkan website crawler-nya yang disebut sebagai GPTBot.
Website crawler ini berfungsi untuk menyelami internet dan mengumpulkan informasi yang akan ditampilkan di ChatGPT.
Webmaster dapat mencegah bot ini untuk mengunjungi situs mereka dengan perintah disallow di dalam file robots.txt.
Google sedang mencari alternatif pelengkap robot.txt untuk mengantisipasi web crawler AI ini.

Pada awal bulan ini, Open AI sebagai platform penyedia ChatGPT telah meluncurkan web crawler yang disebut sebagai GPTBot untuk mengakses informasi di internet dan menyediakannya di platform mereka. Bagaimana tanggapan mesin telusur dan bagaimana cara membatasi crawler tersebut untuk mengakses konten kita? Temukan jawabannya di bawah ini.

Apa itu GPTBot?

Dalam langkah untuk memajukan teknologi kecerdasan buatan (AI), OpenAI telah memperkenalkan GPTBot, sebuah web crawler canggih yang dirancang untuk meningkatkan kemampuan model AI seperti GPT-4 dan GPT-5 yang sangat dinanti.

GPTBot berperan penting dalam pengembangan AI. Web crawler ini dapat diidentifikasi dengan token agen pengguna unik "GPTBot" dan string agen pengguna sebagai berikut:

Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; GPTBot/1.0; +https://openai.com/gptbot)

Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; GPTBot/1.0; +https://openai.com/gptbot)

cmlabs

Fungsi dan Batasan GPTBot

Pada dokumentasi OpenAI, GPTBot akan digunakan dengan cermat untuk memindai dan mengumpulkan data dari halaman web, dengan janji untuk berkontribusi pada kemajuan model AI yang akan datang.

Mereka juga memastikan kualitas dan etika sumber data dengan proses penyaringan yang ketat. Misalnya, pada sumber web yang mengharuskan pembayaran dan melibatkan pengumpulan informasi yang dapat diidentifikasi secara pribadi atau personally identifiable information (PII), maupun teks yang melanggar kebijakan yang telah ditetapkan, secara sistematis akan disaring.

Cara Mengontrol Interaksi GPTBot pada Website

Melalui forum diskusi webmaster world, banyak dari webmaster telah menemukan kunjungan GPTBot pada website mereka dengan frekuensi yang tinggi. Hal ini membuat mereka lebih waspada dan melakukan beberapa hal seperti disallow robot tersebut.

Jika Anda merasa robot AI ini tidak seharusnya mengumpulkan informasi dari situs Anda, maka berikut adalah cara membatasinya.

Implementasikan direktif tertentu dalam file robots.txt situs. Jika Anda ingin sepenuhnya melarang GPTBot mengakses bagian apa pun dari situs Anda, sertakan perintah:

User-agent: GPTBot
Disallow: /

User-agent: GPTBot
Disallow: /

cmlabs

Dengan menambahkan perintah di atas, Anda secara efektif telah memberitahu GPTBot untuk tidak merayapi bagian mana pun dari situs Anda.

Namun, jika Anda ingin memberikan akses tertentu kepada GPTBot pada bagian-bagian tertentu dari situs, Anda dapat menerapkan perintah sebagai berikut:

User-agent: GPTBot
Allow: /directory-1/
Disallow: /directory-2/

User-agent: GPTBot
Allow: /directory-1/
Disallow: /directory-2/

cmlabs

Dalam skenario ini, GPTBot diizinkan untuk mengakses konten dalam "direktori-1," namun secara eksplisit dilarang merayapi "direktori-2." Kontrol ini memungkinkan Anda untuk menyesuaikan akses GPTBot dengan preferensi dan prioritas situs web.

Tanggapan Mesin Telusur

Sebagai tanggapan dari gerakan OpenAI, Google tampaknya sedang mempertimbangkan alternatif lain untuk mencegah crawler GPTBot yang dapat merugikan. Dalam blognya, Google mengumumkan niatnya untuk mengembangkan protokol pelengkap robots.txt yang telah digunakan selama lebih dari tiga dekade. Motivasi di balik langkah ini adalah berkembangnya teknologi AI baru, bukan hanya dari Google tetapi juga dari pemain industri lainnya.

Pengembangan ini menyusul laporan tentang OpenAI yang memanfaatkan konten internet untuk layanan ChatGPT-nya. Perlu dicatat bahwa pengumuman ini belum final. Pernyataan Google lebih menekankan komitmennya untuk terlibat dalam diskusi dan kolaborasi dengan komunitas online.

Dalam pernyataan yang dirilis di Twitter, Google menyatakan:

“Hari ini, kami memulai diskusi publik, mengundang anggota komunitas web dan AI untuk memberikan pendapat tentang pendekatan terhadap protokol pelengkap. Kami ingin melibatkan berbagai suara dari berbagai penerbit web, masyarakat sipil, akademisi, dan bidang lainnya dari seluruh dunia untuk bergabung dalam diskusi ini, dan kami akan mengumpulkan mereka yang tertarik untuk berpartisipasi dalam beberapa bulan mendatang."

Demikian ulasan GPTBot yang saat ini sudah berjalan dan bagaimana Anda dapat membatasi interaksinya dalam situs Anda.

Sumber Artikel
Sebagai penyedia berita yang berdedikasi, kami berkomitmen terhadap akurasi dan keandalan. Kami bekerja ekstra dengan melampirkan sumber yang kredibel untuk mendukung data dan informasi yang kami sajikan.
Dokumentasi OpenAI: https://platform.openai.com/docs/gptbot
Blog Google: https://blog.google/technology/ai/ai-web-publisher-controls-sign-up/
Google Search Liaison Twitter: https://twitter.com/searchliaison/status/1677055071274795009
Forum diskusi Webmaster World: https://www.webmasterworld.com/search_engine_spiders/5091131.htm

Untuk informasi lebih lanjut tentang cmlabs dan layanan kami, silakan hubungi kami di:

E-mail :

marketing@cmlabs.co

Telepon : (0341) 475665

Disclaimer: Semua berita yang dipublikasikan oleh cmlabs telah melalui proses verifikasi dan pengolahan data yang ketat dan berdasar pada Panduan Publikasi cmlabs Meski begitu, data atau inti berita yang kami tulis mungkin saja mengalami perubahan, pengurangan, atau penambahan. Oleh karena itu, cmlabs tidak bertanggung jawab atas segala kerugian yang mungkin timbul karenanya. Kami mendorong pembaca untuk melakukan verifikasi tambahan sebelum mengambil keputusan berdasarkan informasi yang tertera di halaman ini.

Dibagikan 27 kali

Tati Khumairoh

An experienced content writer who is eager in creating engaging and impactful written pieces across various industries. Using SEO approach to deliver high-quality content that captivates readers.

Tulisan lainnya dari Tati

Ditulis dalam Blog

Potensi Ekonomi Digital Indonesia di KTT ke-43

Tue, Sep 5, 2023, 4:38 PM GMT + 7

Ditulis dalam Blog

SEO Copywriting VS. SEO Content Writing

Thu, Nov 16, 2023, 9:39 AM GMT + 7

Ditulis dalam Blog

Tidak Ada Jaminan Ranking Google, Apa yang Dijual SEO Agency?

Mon, Feb 12, 2024, 9:53 AM GMT + 7

Ditulis dalam page.index.short-title

Jasa SEO Banyuwangi - Tingkatkan Performa Website!

Fri, Jan 21, 2022, 1:12 PM GMT + 7

Lihat artikel lainnya

Update berita SEO dari seluruh dunia di cmlabs News -untuk wawasan SEO sehari-hari Anda

cmlabs Berhasil Meraih Medali Perunggu & Top Outstanding Project di Ajang Bergengsi BRICS Industrial Innovation Contest 2025

cmlabs berhasil meraih medali perunggu & Top Outstanding Project pada BRICS Industrial Innovation Contest 2025 dengan Orion, AI untuk data-driven marketing.

cmlabs Menjadi Guest Speaker dalam Pertemuan BRI Group, Angkat Pentingnya SEO untuk PR Corporate Branding

cmlabs hadir sebagai Guest Speaker pada pertemuan BRI Group, membahas pentingnya SEO dalam mendukung PR dan corporate branding di industri keuangan digital.

Mengukuhkan Langkah, cmlabs Perkuat Struktur Manajemen dan Perluas Visi Digital

cmlabs memantapkan langkah sebagai “game changer”, dengan menyegarkan struktur manajemen dan resmi bertransformasi menjadi all-in-one 360° digital marketing partner.

Berita lainnya?