Terlalu Overthinking dan Sulit Bernalar, Model AI Saat Ini Dinilai Masih Jauh dari AGI

Volubit.id — Perlombaan untuk menciptakan Artificial General Intelligence (AGI) atau kecerdasan buatan yang mampu berpikir dan bernalar seperti manusia, dinilai masih jauh dari tujuan. Hal ini diungkapkan oleh para peneliti Apple yang menemukan model AI tercanggih saat ini ternyata masih kesulitan dalam hal penalaran.

Dalam studi terbaru pada Juni ini yang berjudul “The Illusion of Thinking”, para peneliti menjelaskan meskipun upgrade terbaru pada large language model (LLM) seperti ChatGPT dari OpenAI dan Claude dari Anthropic telah menyertakan model penalaran canggih yang disebut Large Reasoning Models (LRM), kemampuan dasar, cara kerja, serta keterbatasannya masih belum sepenuhnya dipahami.

Mereka mencatat, evaluasi terhadap model AI saat ini masih terlalu berfokus pada tes matematika dan pemrograman, yang hanya menilai hasil akhir dengan melihat jawaban benar atau tidak.

Namun menurut mereka, cara ini tidak memberikan gambaran nyata tentang kemampuan berpikir atau bernalar dari model-model tersebut.

Dalam studinya, tim peneliti Apple juga mendesain serangkaian permainan teka-teki untuk menguji perbedaan antara varian AI yang dianggap “berpikir” dan yang tidak. Model yang diuji di antaranya Claude Sonnet, o3-mini dan o1 dari OpenAI, serta DeepSeek-R1 dan V3.

Hasilnya, model LRM yang dianggap canggih ternyata kehilangan akurasi secara drastis saat teka-teki menjadi lebih kompleks. Kemampuan penalaran mereka tidak dapat digeneralisasikan, dan keunggulan yang dimiliki hilang saat tingkat kesulitan meningkat. Hasil ini tentunya bertentangan dengan tujuan dasar AGI.

“Kami menemukan bahwa LRM punya kelemahan dalam melakukan perhitungan yang tepat. Mereka tidak menggunakan algoritma secara eksplisit dan sering kali tidak konsisten dalam memecahkan teka-teki,” tulis para peneliti, disarikan dari Cointelegraph.

Model AI Dinilai Terlalu Overthinking

Penelitian ini juga mengungkap, model AI sering kali mengalami “overthinking” atau berpikir terlalu rumit. Dalam banyak kasus, chatbot AI sebenarnya sudah menghasilkan jawaban benar di awal, tapi kemudian malah melanjutkan ke penalaran yang salah.

Para peneliti menyimpulkan, LRM hanya meniru pola-pola penalaran tanpa benar-benar memahami atau mampu menggeneralisasikannya. Artinya, kemampuan mereka masih jauh dari standar AGI.

“Temuan ini menantang anggapan umum tentang kemampuan LRM, dan menunjukkan bahwa pendekatan saat ini mungkin telah mencapai hambatan mendasar dalam menciptakan penalaran yang benar-benar umum,” tulis mereka.

AGI bisa menjadi tonggak sejarah penting bagi peradaban manusia karena teknologi ini dapat membuat mesin berpikir, memahami, dan bernalar setara dengan manusia.

Pada Januari lalu, CEO OpenAI Sam Altman mengatakan perusahaannya kini semakin dekat untuk mewujudkan AGI.

“Kami kini yakin bahwa kami tahu cara membangunnya, sesuai dengan pengertian AGI yang selama ini kita pahami,” ujarnya.

Sementara itu, CEO Anthropic Dario Amodei pada November lalu memperkirakan AGI bahkan bisa melampaui kemampuan manusia dalam satu atau dua tahun ke depan.

“Kalau kita lihat laju kemajuan kemampuan AI saat ini, rasanya masuk akal bahwa kita bisa mencapainya pada 2026 atau 2027,” kata Amodei.

Leave a Reply

Your email address will not be published. Required fields are marked *