Hati-hati, Ringkasan Google AI Overviews Ternyata Bayak Misinformasi

5 hours ago 1

Jakarta, CNN Indonesia --

Analisis terbaru mengungkap bahwa Google AI Overviews, 'rangkuman instan' yang dibuat oleh AI Google di bagian paling atas hasil pencarian, ternyata menyebarkan informasi yang salah dalam skala besar.

Analisis yang dilakukan oleh perusahaan rintisan AI Oumi, atas permintaan The New York Times, menemukan bahwa ringkasan yang dihasilkan AI yang muncul di atas hasil pencarian Google akurat sekitar 91 persen dari waktu ke waktu.

SCROLL TO CONTINUE WITH CONTENT

Namun di balik itu semua, Google memproses kira-kira sebanyak lima triliun permintaan pencarian setiap tahun. Menurut analisis tersebut, hal itu berarti puluhan juta jawaban yang salah diberikan oleh AI Overviews setiap jam dan ratusan ribu setiap menit.

Dengan kata lain, Google telah menciptakan krisis misinformasi. Analisis itu juga menunjukkan bahwa orang cenderung mempercayai AI tanpa ragu.

Sebuah laporan menemukan bahwa hanya delapan persen pengguna yang memeriksa ulang jawaban AI. Eksperimen lain menemukan bahwa pengguna mendengarkan AI hampir 80 persen dari waktu ketika AI memberikan jawaban yang salah sebuah tren suram yang oleh para peneliti dijuluki "penyerahan kognitif."

Model bahasa besar (LLM) cenderung menggunakan nada yang seolah-olah meyakinkan dan mungkin menyajikan informasi yang dibuat-buat sebagai fakta ketika mereka tidak dapat menemukan jawaban yang jelas.

Mengingat kemudahan yang ditawarkan oleh AI Overviews dari Google, mudah untuk membayangkan bahwa banyak sekali pengguna yang menerima ringkasan tersebut begitu saja.

Oumi melakukan analisis menggunakan SimpleQA, tolok ukur industri yang banyak digunakan untuk akurasi AI yang dirancang oleh OpenAI. Putaran pertama pengujian, yang dilakukan pada bulan Oktober, menggunakan versi AI Overviews yang didukung oleh model Gemini 2 dari Google.

Pengujian lanjutan pada bulan Februari menguji fitur tersebut setelah beralih ke Gemini 3, pembaruan yang sangat digembar-gemborkan.

Setiap putaran pengujian melibatkan 4.326 pencarian Google. Gemini 3 adalah model yang lebih akurat, memberikan respons yang faktual 91 persen dari waktu.

Sementara, kinerja Gemini 2 jauh lebih buruk dengan akurasi hanya 85 persen.

Di satu sisi, hal ini menunjukkan bahwa model-model tersebut semakin membaik. Di sisi lain, hal ini menunjukkan bahwa Google bersedia memaksakan model yang bahkan lebih rentan menghasilkan informasi yang tidak akurat kepada penggunanya sebagai bagian dari eksperimen yang masih berlangsung dan terus menyesatkan ratusan juta orang.

Menanggapi temuan tersebut, Google menyebut analisis tersebut cacat.

"Studi ini memiliki kelemahan serius," kata juru bicara Google, Ned Adriance, dalam pernyataan kepada NYT, melansir Futurism.

"Ini tidak mencerminkan apa yang sebenarnya dicari orang di Google," lanjutnya.

Namun, menurut laporan tersebut, pengujian yang dilakukan Google sendiri justru menggambarkan gambaran yang sama buruknya. Analisis internal terhadap Gemini 3 menemukan bahwa model AI tersebut menghasilkan informasi yang salah sebanyak 28 persen dari waktu.

Namun, Google mengklaim bahwa AI Overviews lebih akurat karena mereka mengacu pada hasil pencarian Google sebelum memberikan jawaban.

Peningkatan antara Gemini 2 dan Gemini 3 mungkin menyembunyikan kelemahan yang lebih serius. Menurut analisis OpenAI, Gemini 2 memberikan jawaban yang "tidak berdasar" pada 37 persen kasus, yang berarti ringkasan AI tersebut mengutip situs web yang tidak mendukung informasi yang diberikan.

Namun, pada Gemini 3, angka ini meningkat menjadi 56 persen. Selain menunjukkan bahwa AI tersebut mengada-ada, jawaban yang tidak berdasar membuat pengguna sulit untuk memverifikasi klaim AI tersebut.

(wpj/dmi)

Add