Studi Ungkap 10%+ Sumber Google AI Overview Ternyata Konten Buatan

Sebuah studi terbaru mengungkapkan bahwa lebih dari 10% tautan sumber yang digunakan dalam fitur Google AI Overview (AIO) diduga berasal dari konten yang dibuat oleh kecerdasan buatan (AI). Temuan ini menimbulkan kekhawatiran terkait risiko terjadinya feedback loop atau “AI belajar dari AI” yang berpotensi menurunkan kualitas informasi di internet.

Google AI Overview merupakan fitur baru pada mesin pencari Google yang menggunakan AI generatif untuk memberikan ringkasan hasil pencarian secara langsung di bagian atas halaman. Berbeda dengan pendekatan tradisional yang hanya menampilkan daftar tautan, fitur ini merangkum informasi dari berbagai sumber untuk memberikan jawaban singkat kepada pengguna.

Metode dan Hasil Analisis Studi

Penelitian ini dilakukan oleh Originality.ai, sebuah perusahaan yang fokus mengembangkan perangkat lunak pendeteksi konten AI. Mereka menganalisis 29.000 pencarian Google pada topik Your Money or Your Life (YMYL), yang mencakup isu-isu penting seperti kesehatan, keuangan, dan keselamatan. Studi membandingkan sumber-sumber yang digunakan Google di AI Overview dengan 100 hasil pencarian organik teratas.

Berdasarkan model deteksi AI Detection Lite 1.0.1 yang dikembangkan oleh Originality.ai, ditemukan bahwa:

  1. 10,4% sumber di AI Overview diduga merupakan konten yang dibuat oleh AI.
  2. 74,4% konten berasal dari manusia.
  3. 15,2% sumber tidak dapat diklasifikasi karena berbagai alasan, seperti tautan rusak, teks yang sangat sedikit, atau berformat video/PDF.

Selain itu, studi menemukan bahwa lebih dari setengah sumber (52%) yang muncul di AI Overview tidak termasuk dalam 100 hasil pencarian organik teratas. Dari kelompok sumber ini, 12,8% juga teridentifikasi sebagai konten AI—proporsi yang lebih tinggi dibandingkan rata-rata seluruh sampel.

Risiko Model Collapse dan Dampaknya pada Kualitas Informasi

Fenomena ini menimbulkan kekhawatiran terjadi model collapse, yaitu kondisi ketika model AI secara bertahap menurun kualitasnya lantaran terlalu sering dilatih dengan data hasil kreasi AI. Konsep ini dijelaskan dalam riset berjudul The Curse of Recursion oleh tim peneliti dari Inggris dan Kanada pada tahun 2023. Makalah tersebut mengungkapkan bahwa latihan berulang pada data yang dihasilkan AI dapat menimbulkan cacat yang sulit diperbaiki pada model.

Originality.ai menilai meskipun AI Overview bukanlah bagian dari data pelatihan langsung Google, eksposur konten AI di fitur ini justru berpotensi meningkatkan visibilitas dan penerimaan konten tersebut sebagai sumber yang sah. Hal ini dapat menyebabkan konten AI lebih sering digunakan dalam pelatihan generasi AI selanjutnya, memperkuat siklus feedback loop yang merugikan.

Respons dari Google

Menanggapi penelitian ini, perwakilan Google membantah temuan tersebut. Google menyatakan hasil studi tersebut kurang akurat karena mengandalkan teknologi pendeteksi AI yang saat ini masih belum terbukti handal. “Ini adalah studi yang cacat karena mengandalkan data parsial dan teknologi yang tidak dapat diandalkan. Detektor AI belum terbukti efektif mendeteksi konten AI dan banyak di antaranya terbukti rawan kesalahan,” ujar juru bicara Google seperti dikutip dari Techspot.

Meski begitu, Originality.ai menegaskan bahwa perangkat lunak mereka telah melalui berbagai pengujian independen dan menunjukkan tingkat akurasi yang tinggi dalam mendeteksi konten AI.

Dampak Konten AI pada Pencarian dan Masa Depan AI

Keterlibatan konten AI dalam sumber data Google AI Overview membuka diskusi penting tentang pengelolaan kualitas informasi di era kecerdasan buatan. Dengan semakin banyaknya konten yang dihasilkan AI dan digunakan sebagai referensi, ada risiko berkurangnya keaslian dan akurasi informasi yang diterima oleh pengguna.

Penting bagi para pengembang dan platform teknologi, termasuk Google, untuk terus meningkatkan metode penyaringan dan verifikasi sumber agar dapat menjaga kualitas hasil pencarian. Selain itu, riset dan pengembangan teknologi pendeteksi konten AI yang lebih canggih juga menjadi krusial untuk menghindari degradasi model AI secara menyeluruh.

Studi ini sekaligus mengingatkan seluruh ekosistem digital bahwa integrasi AI dalam dunia informasi harus dilakukan dengan kehati-hatian agar tidak menimbulkan dampak negatif jangka panjang terhadap kualitas pengetahuan yang tersedia di internet.

Berita Terkait

Back to top button