Studi Apple Ungkap Kelemahan Penalaran AI OpenAI, Google dan Meta

AKURAT.CO Sebuah studi terbaru dari Apple mengungkap bahwa kemampuan penalaran kecerdasan buatan (AI) belum sekuat yang selama ini dipercaya. Temuan ini menyoroti keterbatasan model bahasa besar (LLM) yang dikembangkan perusahaan teknologi global.
LLM dari OpenAI, Google dan Meta dikenal memiliki kemampuan analisis yang mengesankan. Namun, penelitian Apple menunjukkan bahwa kemampuan tersebut lebih dekat pada pengenalan pola daripada penalaran logis yang mendalam.
Selama ini, kemampuan penalaran AI sering diukur menggunakan tolok ukur populer seperti GSM8K. Masalahnya, dataset yang terlalu sering digunakan berpotensi membuat model AI hanya mengingat jawaban dari data pelatihan.
Untuk mengatasi bias tersebut, peneliti Apple mengembangkan metode evaluasi baru bernama GSM-Symbolic. Metode ini mempertahankan struktur soal, tetapi mengubah variabel seperti angka, nama dan tingkat kompleksitas.
Selain itu, peneliti juga menambahkan informasi yang tidak relevan ke dalam soal untuk menguji ketahanan penalaran AI. Tujuannya adalah melihat apakah model benar-benar memahami masalah atau hanya mengikuti pola tertentu.
Hasil pengujian menunjukkan bahwa performa banyak model AI menurun ketika variabel soal diubah. Penurunan akurasi terjadi pada hampir semua model yang diuji, termasuk model dari OpenAI, Google dan Meta.
Dalam pengujian, model OpenAI cenderung memiliki performa lebih baik dibandingkan model sumber terbuka. Meski demikian, perbedaan hasil antar model tetap dianggap signifikan oleh para peneliti.
Penurunan performa menjadi lebih jelas ketika soal mengandung informasi tambahan yang tidak relevan. Banyak model AI justru salah menafsirkan detail tersebut dan memasukkannya ke dalam perhitungan.
Studi dari Apple mengungkap kelemahan serius dalam kemampuan LLM. "Cacat kritis dalam kemampuan LLM untuk benar-benar memahami konsep matematika dan membedakan informasi yang relevan untuk pemecahan masalah," dikutip dari Mashable, Minggu (1/2/2026).
Meski penelitian dilakukan oleh Apple yang juga mengembangkan teknologi AI sendiri, hasilnya tetap relevan bagi industri teknologi. Studi ini menjadi pengingat bahwa kemampuan AI perlu dinilai secara kritis, bukan hanya berdasarkan hype.
Dilarang mengambil dan/atau menayangkan ulang sebagian atau keseluruhan artikel di atas untuk konten akun media sosial komersil tanpa seizin redaksi.
Berita Terkait
Berita Terkini
Terpopuler
- 1Cuma Jadi Beban Istana, Menteri Pariwisata Tak Punya Sense of Crisis dan Layak Diganti
- 2Usai Kritik Pigai, Hotman Paris Kini Malah Ingin Jalan Malam Bareng Menteri HAM: Biar Begal Kabur Semua
- 3Prediksi Skor Prancis vs Pantai Gading 5 Juni 2026: Les Bleus Masih Terlalu Kuat atau The Elephants Siap Membuat Kejutan?
- 4Prediksi Skor PSG vs Arsenal, Susunan Pemain, Jadwal Siaran Langsung
- 5Berbahasa Indonesia Usai Laga Kalahkan Oman, John Herdman: Saya Capek!
- 6BRIN Ingatkan Wacana Jokowi Keliling Daerah Berpotensi Memanaskan Politik Terlalu Dini
- 7Tragedi di Gurun Sahara: 49 Orang Tewas Kehausan Setelah Truk Mogok di Gurun Niger
- 8Kurs Dolar AS Tembus Rp18.025 Hari Ini, Rupiah Catat Rekor Terlemah dalam Sejarah
- 9Astra Gandeng Pemprov Jakarta Kampanyekan Naik Transportasi Umum, Pramono: Kunci Atasi Macet dan Polusi
- 10Trump Klaim Kekuatan Militer Iran Hancur Total, Tersisa Sekitar 21 Persen Rudal








