Kami menggunakan cookies
Situs ini menggunakan cookies dari cmlabs untuk memberikan dan meningkatkan kualitas layanannya serta menganalisis lalu lintas..
Kami menggunakan cookies
Situs ini menggunakan cookies dari cmlabs untuk memberikan dan meningkatkan kualitas layanannya serta menganalisis lalu lintas..
Dipublikasikan Jan 30, 2025 08:01 | Terakhir diperbarui pada Jan 30, 2025 08:01 oleh Rochman Maarif
The eventualities merupakan sebuah keniscayaan yang mendorong setiap pelaku usaha untuk menyiapkan skenario dan beradaptasi. Saksikan podcast Anti-Trivial bersama Mas Rochman, Bro Jimmy, dan Pak Agus; kombinasi antara pelaku usaha, pemodal, dan pemimpin perusahaan, yang akan membahas bagaimana meningkatkan kewaskitaan para pemimpin perusahaan dalam menyambut tahun 2025. Jangan lewatkan edisi spesial akhir tahun cmlabs Class ke-24 ini, dalam judul "New vs Conventional Search Engine. Prepare for the Eventualities!"
Lihat Detail EventSemakin berkembangnya teknologi, kecerdasan buatan atau Artificial Intelligence (AI) mulai merambah ke dalam segala aktivitas manusia, termasuk pencarian informasi.
Kini, mulai banyak orang mencari informasi menggunakan alat berbasis AI, salah satunya ChatGPT yang dikembangkan oleh OpenAI.
Menurut sebuah survei, 45% pengusaha dan pekerja di Indonesia telah menggunakan aplikasi AI. Selanjutnya, 52% dari total pekerja yang menggunakan aplikasi AI tersebut mengaku menggunakan ChatGPT.
Namun, yang menjadi perhatian, apakah ChatGPT yang berbasis kecerdasan buatan ini sudah “peka” terhadap kaidah penulisan dalam bahasa Indonesia, termasuk penggunaan kata baku?
Hal ini penting untuk diperhatikan karena pengguna bisa saja menggunakan model ini untuk mencari informasi yang kemudian digunakan untuk kepentingan profesional atau akademis.
Untuk menjawab pertanyaan tersebut, kami melakukan eksperimen untuk melihat bagaimana ChatGPT memberikan hasil dari prompt dalam bahasa Indonesia.
Dalam proses penelitian, kami melakukan tiga aktivitas pengumpulan data, yaitu memasukkan prompt pertanyaan dengan kata baku, kata tidak baku, dan prompt translasi dari bahasa Inggris ke bahasa Indonesia.
Sebelum masuk ke hasil eksperimen dan pembahasan, mari pelajari dengan singkat mengenai ChatGPT.
Chat Generative Pre-training Transformer atau ChatGPT adalah chatbot berbasis kecerdasan buatan yang menggunakan Natural Language Processing (NLP) untuk membuat dialog konversasional yang menyerupai manusia.
Model bahasa ini dapat merespon pertanyaan serta membuat tulisan, seperti esai, artikel, dan masih banyak lagi. Aplikasi ini juga menggunakan teknologi deep learning sehingga dapat menjawab berbagai prompt dengan beragam skema.
ChatGPT merupakan bentuk kecerdasan buatan generatif atau generative AI yang dapat mempelajari umpan balik manusia dan mengurutkan respon terbaik melalui reinforcement learning from human feedback (RLHF) setelah pengguna memasukkan prompt.
Lebih lanjut, ChatGPT mendapatkan data-data dari jutaan dokumen yang ada di internet, termasuk artikel, percakapan, dan buku sehingga bisa memberikan jawaban yang komprehensif sesuai konteks.
Berbicara tentang ChatGPT, Anda akan menemui istilah deep learning dan natural language processing (NLP). Deep learning merupakan metode kecerdasan buatan yang melatih komputer agar bisa memproses data seperti otak manusia.
Dengan begitu, komputer bisa memahami gambar, suara, teks, atau bentuk data lain untuk memberikan hasil yang komprehensif.
Salah satu bentuk penggunaan deep learning adalah natural language processing (NLP) atau pemrosesan bahasa alami. NLP menggabungkan linguistik komputasi dengan algoritma machine learning dan deep learning.
Linguistik komputasi menggunakan data science untuk menganalisis bahasa dan tuturan, yang di dalamnya juga mencakup analisis sintaksis dan semantik.
NLP membantu AI untuk merangkum teks secara otomatis, menganalisis teks, serta menelaah sentimen di media sosial. Dengan begitu, model AI bisa memahami konteks tulisan dengan baik.
Selain itu, AI juga ditunjang oleh reinforcement learning from human feedback (RLHF) yang membantu machine learning untuk belajar mandiri secara efisien.
RLHF menggabungkan umpan balik manusia dalam fungsi penghargaan sehingga model machine learning dapat melakukan tugas yang lebih sesuai dengan tujuan, keinginan, dan kebutuhan manusia.
RLHF diakui sebagai teknik standar industri untuk memastikan bahwa large language models (LLM) menghasilkan konten yang faktual, tidak berbahaya, dan bermanfaat.
Tidak hanya itu, nilai dan preferensi manusia juga memengaruhi keluaran LLM. Setiap model dilatih sedikit berbeda dan menggunakan responden manusia yang berbeda sehingga hasilnya dapat berbeda bahkan antar-LLM.
ChatGPT merupakan model kecerdasan buatan yang banyak diandalkan pengguna untuk mencari informasi. Seperti yang telah dijelaskan sebelumnya tentang deep learning dan NLP, AI seperti ChatGPT memiliki kemampuan untuk mempelajari masukan yang ada sehingga dapat memberikan hasil yang komprehensif.
Namun, apakah hal tersebut berpengaruh pada kaidah penulisan dalam bahasa Indonesia, khususnya penggunaan kata baku dan tidak baku? Maka dari itu, kami menganalisis dua poin penting, yaitu:
Untuk menjawab kedua pertanyaan tersebut, kami telah mengumpulkan 16 pasang kata baku dan tidak baku dari prompt yang dimasukkan ke ChatGPT tanpa akun. Kami pun memasukkan 8 prompt berbahasa Inggris untuk menjawab poin kedua.
Catatan: ChatGPT yang kami gunakan tidak memiliki akun (kami tidak mendaftarkan akun email) sehingga hasil dari prompt kemungkinan besar tidak dipengaruhi oleh riwayat penggunaan.
ChatGPT telah menjadi salah satu aplikasi yang membantu banyak kebutuhan manusia, khususnya dalam membuat tulisan atau mencari informasi. Artinya, ChatGPT dapat digunakan oleh banyak lapisan pengguna, dari pekerja hingga akademisi.
Itulah mengapa penting bagi AI ini untuk mengikuti kaidah penulisan yang ada. Terlebih lagi, ChatGPT telah tersedia di banyak bahasa, membuatnya harus bisa beradaptasi dengan kaidah penulisan di setiap jawaban untuk menyajikan hasil yang mendalam.
Sebuah penelitian yang dipublikasikan pada Computer Methods and Programs in Biomedicine Update tahun 2024 mengungkapkan bahwa AI telah membantu akademisi dan pelajar dalam 6 dimensi, di antaranya:
Dalam hal ini, AI diharapkan mampu memberikan hasil terbaik bahkan hingga sisi penulisannya. Penelitian yang sama pun mengungkapkan bahwa dari 24 penelitian yang menggunakan AI, terdapat beberapa studi yang memiliki batasan pada pengembangan tulisan, koreksi bahasa, serta tantangan pada pengembangan tulisan yang tidak menggunakan bahasa Inggris.
Artinya, model AI, salah satunya ChatGPT, diharapkan dapat memberikan hasil yang tidak hanya komprehensif, tetapi juga dapat menjawab berbagai macam prompt dengan kaidah penulisan yang benar.
Isu tersebut menjadi alasan mengapa kami ingin melihat sudahkah ChatGPT mengikuti kaidah penulisan dari KBBI untuk kalimat baku.
Untuk menjawab pertanyaan tersebut, kami telah melakukan eksperimen sederhana pada model AI ini dengan berfokus pada penggunaan kata baku di setiap hasil yang diberikan ChatGPT.
Selama pengumpulan data, kami menggunakan ChatGPT gratis tanpa akun, artinya besar kemungkinan model AI ini tidak menyimpan riwayat pencarian atau prompt apa pun dan tidak mempelajari preferensi pengguna. Hal ini kami lakukan untuk menghindari biased result akibat model AI yang telah mempelajari pola prompt. Untuk tipe ChatGPT yang digunakan pada riset ini adalah ChatGPT-4o.
Kami membatasi sampel penelitian hingga 40 sampel untuk tiga jenis prompt, yaitu 1) prompt yang menggunakan kata baku, 2) prompt yang menggunakan kata tidak baku, dan 3) prompt yang memerintahkan model AI untuk menerjemahkan sebuah paragraf dari bahasa Inggris ke bahasa Indonesia.
Tiga jenis prompt tersebut dipilih untuk melihat bagaimana ChatGPT memberikan jawaban terlepas dari kesalahan penulisan yang dibuat oleh pengguna serta dataset bahasa seperti apa yang dimiliki oleh model AI ini.
Hasil penelitian pertama yang akan kami ungkap datang dari prompt dengan kata baku dan tidak baku dalam bahasa Indonesia. Kami memasukkan 16 pasang prompt yang serupa, tetapi berbeda dari sisi kata baku yang dimasukkan.
Sebagai contoh, kami memasukkan prompt “apa itu asas legalitas?” dengan kata baku asas dan “apa itu azas legalitas?” dengan kata tidak baku azas untuk melihat apakah ChatGPT memberikan hasil sesuai kaidah kebakuan atau mengikuti prompt yang dimasukkan.
Tentunya, kata baku yang kami pilih telah terdaftar di Kamus Besar Bahasa Indonesia (KBBI). Dalam bentuk tabel, berikut adalah hasil dari percobaan tersebut:
Tabel 1: Hasil Penelitian 1
No. | Prompt | KBBI | Hasil ChatGPT | Kesesuaian dengan KBBI |
1. | Aktivitas apa yang bisa dilakukan ibu hamil agar tetap sehat? (Baku) | Aktivitas | Aktivitas | Benar |
2. | Aktifitas apa yang bisa dilakukan ibu hamil agar tetap sehat? (Tidak Baku) | Aktivitas | Aktivitas | Benar |
3. | Apakah kemampuan analisis masih dibutuhkan di era digitalisasi? (Baku) | Analisis | Analisis | Benar |
4. | Apakah kemampuan analisa masih dibutuhkan di era digitalisasi? (Tidak Baku) | Analisis | Analisis | Benar |
5. | Bagaimana cara menjadi pegawai yang andal meskipun tidak punya banyak pengalaman? (Baku) | Andal | Andal | Benar |
6. | Bagaimana cara menjadi pegawai yang handal meskipun tidak punya banyak pengalaman? (Tidak Baku) | Andal | Handal | Salah |
7. | Apa itu asas legalitas? (Baku) | Asas | Asas | Benar |
8. | Apa itu azas legalitas? (Tidak Baku) | Asas | Azas | Salah |
9. | Bagaimana cara membuat karya tulis yang autentik? (Baku) | Autentik | Autentik | Benar |
10. | Bagaimana cara membuat karya tulis yang otentik? (Tidak Baku) | Autentik | Otentik | Salah |
11. | Kemampuan berpikir seperti apa yang diperlukan untuk bisa menjadi seorang diplomat? (Baku) | Pikir | Pikir | Benar |
12. | Kemampuan berfikir seperti apa yang diperlukan untuk bisa menjadi seorang diplomat? (Tidak Baku) | Pikir | Pikir | Benar |
13. | Manfaat makan cabai? (Baku) | Cabai | Cabai | Benar |
14. | Manfaat makan cabe? (Tidak Baku) | Cabai | Cabai | Benar |
15. | Penanganan cedera lutut (Baku) | Cedera | Cedera | Benar |
16. | Penanganan cidera lutut (Tidak Baku) | Cedera | Cedera | Benar |
17. | Masakan yang menggunakan cengkih (Baku) | Cengkih | Cengkih | Benar |
18. | Masakan yang menggunakan cengkeh (Tidak Baku) | Cengkih | Cengkeh | Salah |
19. | Ras manusia apa saja yang memiliki mata cokelat? (Baku) | Cokelat | Cokelat | Benar |
20. | Ras manusia apa saja yang memiliki mata coklat? (Tidak Baku) | Cokelat | Coklat | Salah |
21. | Cara mengobati alergi detergen (Baku) | Detergen | Detergen | Benar |
22. | Cara mengobati alergi deterjen (Tidak Baku) | Detergen | Deterjen | Salah |
23. | Apakah seorang perawat boleh melakukan diagnosis pada pasien? (Baku) | Diagnosis | Diagnosis | Benar |
24. | Apakah seorang perawat boleh melakukan diagnosa pada pasien? (Tidak Baku) | Diagnosis | Diagnosis dan Diagnosa | Beberapa benar |
25. | Jika terjebak di area dengan suhu esktrem, apa yang seharusnya dilakukan? (Baku) | Esktrem | Ekstrem | Benar |
26. | Jika terjebak di area dengan suhu esktrim, apa yang seharusnya dilakukan? (Tidak Baku) | Ekstrem | Ekstrem dan Ekstrim | Beberapa benar |
27. | Apakah aman memakan makanan kedaluwarsa? (Baku) | Kedaluwarsa | Kedaluwarsa | Benar |
28. | Apakah aman memakan makanan kadaluarsa? (Tidak Baku) | Kedaluwarsa | Kadaluwarsa dan Kadaluarsa | Salah |
29. | Seberapa penting orisinalitas konten untuk situs web? (Baku) | Orisinal | Orisinal | Benar |
30. | Seberapa penting orisinilitas konten untuk situs web? (Tidak Baku) | Orisinal | Orisinal | Benar |
31. | Seberapa besar risiko kematian orang dengan komplikasi diabetes dan kolesterol? (Baku) | Risiko | Risiko | Benar |
32. | Seberapa besar resiko kematian orang dengan komplikasi diabetes dan kolesterol? (Tidak Baku) | Risiko | Risiko | Benar |
Dari 32 prompt yang diberikan berdasarkan penjabaran di atas, terdapat 24 hasil yang menggunakan kata baku yang tepat terlepas dari kata yang digunakan pada prompt. Kemudian, 7 lainnya menunjukkan kata tidak baku pada hasil ketika prompt dengan kata tidak baku diberikan.
Dari data tersebut, hipotesis kami adalah ChatGPT mungkin memiliki dataset kata baku yang memadai sehingga dapat memberikan jawaban yang ekstensif sesuai kaidah penulisan. Namun, model AI ini mungkin juga memiliki kecenderungan mengikuti prompt yang diberikan, terlihat dari 7 hasil salah yang mengikuti prompt dengan kata tidak baku, meskipun hanya 21,9% dari keseluruhan hasil.
Uniknya, terdapat 2 kasus menarik di mana ChatGPT memberikan hasil yang beragam, yaitu menggunakan kedua versi kata (baku dan tidak baku) pada prompt tidak baku. Kasus yang pertama terdapat pada prompt “apakah seorang perawat boleh melakukan diagnosa pada pasien?” yang merupakan prompt dengan kata tidak baku diagnosa.
Hasilnya, ChatGPT memberikan jawaban menggunakan kata diagnosa (tidak baku) dan diagnosis (baku) seperti yang terlihat pada bukti di bawah ini.
Prompt A merupakan prompt dengan kata tidak baku, sedangkan prompt B menggunakan kata baku. Label hijau menandakan bahwa jawaban yang ditargetkan menggunakan kata baku, sedangkan label merah menandakan kata tidak baku.
Pada prompt A, dapat dilihat bahwa ChatGPT menggunakan kata diagnosa dan diagnosis, sedangkan pada prompt B, ChatGPT berhasil menampilkan jawaban dengan kata baku.
Kasus unik ini juga terjadi pada prompt “jika terjebak di area dengan suhu esktrim, apa yang seharusnya dilakukan?”. Dengan penggambaran yang sama seperti prompt di atas, berikut perbandingan hasilnya:
Jawaban pada prompt A menunjukkan bahwa ChatGPT menggunakan kata ekstrem dan ekstrim, sedangkan prompt B berhasil menggunakan kata baku esktrem.
Hipotesis yang kami dapatkan dari kasus ini adalah ChatGPT mungkin telah mempelajari bahwa ekstrem dan diagnosis merupakan kata baku yang sesuai kaidah penulisan, tetapi ada kemungkinan model AI ini terpengaruh oleh prompt yang diberikan.
Alasannya dapat dilihat dari perbandingan di atas, di mana model AI ini bisa memberikan jawaban sesuai dengan kata baku pada prompt B, tetapi juga bisa berubah menjadi tidak baku ketika prompt A diberikan.
Beberapa penelitian mengungkapkan bahwa prompt mungkin dapat memengaruhi jawaban yang diberikan oleh ChatGPT. Model AI ini bisa menyesuaikan permintaan pengguna melalui prompt yang diberikan.
Selain itu, terdapat 1 kasus unik lainnya dari 7 hasil salah, di mana prompt “apakah aman memakan makanan kadaluarsa?” memberikan dua hasil yang salah, seperti yang diilustrasikan di bawah ini:
Pada prompt A, kami memberikan kata kadaluarsa yang merupakan kata tidak baku dari kedaluwarsa. Hasilnya, ChatGPT memberikan jawaban yang mengandung kata kadaluarsa (label merah) dan kadaluwarsa (label kuning), di mana keduanya merupakan kata tidak baku.
Namun, di prompt B, model AI ini berhasil memberikan jawaban dengan kata baku kedaluwarsa setelah kami memberikan prompt yang mengandung kata baku kedaluwarsa.
Terkait hasil ini, kami berasumsi bahwa hasil tersebut berkaitan dengan kemampuan ChatGPT untuk mendapatkan data dari dokumentasi yang ada di internet. Di mesin pencari sendiri, kata kadaluarsa dan kadaluwarsa masih banyak digunakan oleh pengguna dan konten-konten yang bertebaran, meskipun banyak pula yang menggunakan kata kedaluwarsa.
Artinya, ChatGPT mungkin memiliki dataset untuk ketiga kata tersebut. Jawaban pada prompt A juga mungkin dipengaruhi oleh prompt kata tidak baku yang diberikan, melihat bahwa dengan kata baku pada prompt B pun, ChatGPT masih bisa memberikan jawaban dengan kata baku.
Untuk menguji kaidah penulisan dalam bahasa Indonesia, kami juga menguji 8 prompt yang memerintahkan ChatGPT untuk menerjemahkan paragraf dan kalimat berbahasa Inggris ke bahasa Indonesia.
Dari 8 prompt tersebut, terdapat 4 jawaban ChatGPT yang menggunakan kata tidak baku pada salah satu kata-katanya, dan terdapat 4 jawaban yang tepat menggunakan kata baku di seluruh katanya.
Sampel di bawah ini menjelaskan salah satu dari masing-masing hasil.
Pada gambar ini, dapat dilihat bahwa ChatGPT memberikan terjemahan untuk turnover dengan omset. Padahal, omset merupakan kata tidak baku dari omzet sesuai Kamus Besar Bahasa Indonesia (KBBI).
Kemudian, dari 4 hasil jawaban ChatGPT yang mengandung kata baku, gambar di atas merupakan salah satu sampelnya. ChatGPT berhasil menerjemahkan standardization menjadi standardisasi dan standard menjadi standar, yang mana sesuai dengan Kamus Besar Bahasa Indonesia.
Karena hasilnya yang imbang, dapat disimpulkan bahwa ChatGPT mungkin memiliki dataset kata baku yang mumpuni, meskipun di antara data-data tersebut, model AI ini mungkin juga menyimpan kata tidak baku hasil dari menyerap berbagai macam dokumentasi.
Kesimpulan
Eksperimen ini dibuat untuk menjawab dua pertanyaan besar kami, yaitu apakah ChatGPT dapat memberikan jawaban sesuai kaidah penulisan bahasa Indonesia yang baik dan benar atau hanya mengikuti prompt. Selain itu, kami juga mengulik apakah model AI ini dapat memberikan terjemahan bahasa Indonesia yang tepat dari paragraf berbahasa Inggris.
Untuk pertanyaan pertama, hasil yang kami dapatkan adalah ChatGPT berhasil menjawab 24 prompt sesuai dengan kebakuan kata, 7 jawaban kurang tepat, dan 2 jawaban merupakan kasus spesial karena memiliki kombinasi kata baku dan tidak baku dalam satu jawabannya.
Dari sini, kami berasumsi bahwa ChatGPT mungkin memiliki dataset kata baku yang baik, tetapi model AI ini mungkin masih mengikuti prompt yang diberikan sehingga jawabannya mengandung kata tidak baku. Atau, kemungkinan lainnya adalah ChatGPT memang memiliki dataset dalam bentuk kata tidak baku hasil dari menyerap dokumentasi di internet yang beragam.
Untuk pertanyaan kedua, hasil yang kami dapatkan adalah imbang antara jumlah terjemahan dengan kata baku dan tidak baku sehingga kami berasumsi bahwa mungkin ChatGPT memiliki dataset untuk kedua jenis kebakuan kata.
Perlu dicatat bahwa hasil eksperimen ini dapat berbeda di percobaan atau perangkat lain. Hasilnya juga mungkin beragam dari satu akun dengan akun lainnya. Selain itu, riwayat penggunaan ChatGPT dengan akun juga dapat memengaruhi hasil eksperimen.
Eksperimen ini pun juga dilakukan sebanyak satu kali untuk setiap prompt sehingga kami tidak melihat hasil di percobaan lain. Oleh karena itu, eksperimen ini bisa menjadi landasan awal untuk penelitian kaidah penulisan untuk model AI lainnya yang akan datang.
Demikian informasi tentang penelitian sederhana yang kami lakukan untuk melihat kebakuan jawaban yang diberikan ChatGPT. Penggunaan model AI memang harus diperhatikan kembali, khususnya untuk kebutuhan komersial.
Karena kemampuannya yang masih sedikit rancu dalam memberikan jawaban sesuai kaidah kebahasaan yang tepat, ada baiknya Anda memilih partner menulis yang tepat, salah satunya Jasa Penulisan Artikel cmlabs.
Jasa Penulisan Artikel cmlabs dikerjakan oleh penulis-penulis andal dengan pengalaman di berbagai macam niche, mulai dari kesehatan hingga konstruksi.
Hasil tulisan kami juga terus menyumbangkan engagement bagi klien dan dipercaya oleh nama-nama bersar, seperti AQUA, Siloam Hospitals, dan masih banyak lagi.
Jadi, tunggu apa lagi? Jadwalkan pertemuan dengan tim pemasaran kami dan ceritakan kebutuhan artikel Anda sekarang!
Terima kasih sudah meluangkan waktu untuk membaca tulisan saya! Di cmlabs, kami senang berbagi artikel-artikel baru dan keren seputar SEO setiap minggunya. Jadi, kamu akan selalu mendapatkan informasi terkini tentang topik yang kamu minati. Jika kamu benar-benar suka dengan konten-konten di cmlabs, kamu bisa bergabung dengan newsletter email kami. Dengan berlangganan, kamu akan mendapatkan pembaruan langsung di kotak masukmu. Oh ya, kalau kamu tertarik untuk berkontribusi sebagai penulis di cmlabs, jangan khawatir! Kamu bisa menemukan informasi lebih lanjut di sini. Jadi, ayo bergabung dengan komunitas cmlabs dan ikuti perkembangan terbaru seputar SEO bersama kami!
Bagaimana pendapat Anda? Apakah Anda menyukai artikel ini?