BMJ Dergisinde Yayımlanan Çalışmaya Göre, Yapay Zeka Modellerinin Bilişsel Yetenekleri Değerlendirildi

Yeni Kalem 19 Aralık 2024

0 Yorum Yapıldı

Bağlantı kopyalandı!

BMJ Dergisinde Yayımlanan Çalışmaya Göre, Yapay Zeka Modellerinin Bilişsel Yetenekleri Değerlendirildi

Popüler Yapay Zeka Modelleri Bilişsel Testte Zayıf Performans Gösterdi

The BMJ dergisinde yayımlanan bir araştırmaya göre, ChatGPT 4, Claude 3.5 ve Gemini gibi popüler yapay zeka modelleri, Montreal Bilişsel Değerlendirme Testi’nde (MoCA) düşük puanlar aldı. Bu test, dikkat, hafıza, dil, görsel-uzamsal beceriler ve yürütücü işlevler gibi bilişsel yetileri ölçmek için kullanılıyor.

Eski Yapay Zeka Modelleri Daha Düşük Performans Gösterdi

Çalışma, tıpkı yaşlanan insan hastalar gibi, daha eski yapay zeka modellerinin de testlerde daha düşük performans gösterdiğini ortaya koydu. Yazarlar, bu bulguların yapay zekanın insan doktorların yerini alacağı düşüncesini sorgulattığını öne sürüyor.

Yapay Zeka Gelişmeleri ve Endişeler

Son dönemdeki yapay zeka gelişmeleri, sohbet robotlarının tıp alanındaki görevlerde insan doktorları geçip geçemeyeceği konusunda hem heyecan hem de endişe uyandırdı. Önceki çalışmalar, büyük dil modellerinin çeşitli tıbbi teşhis görevlerinde başarılı olduğunu gösterse de, bilişsel bozukluklara karşı olası kırılganlıklar şimdiye kadar pek araştırılmamıştı.

Yapay Zeka Modellerinin Değerlendirilmesi

Araştırmacılar, ChatGPT 4, ChatGPT 4o, Claude 3.5 ve Gemini 1, Gemini 1.5 gibi büyük dil modellerini, Montreal Bilişsel Değerlendirme (MoCA) testi üzerinde değerlendirdiler. Bu test, genellikle yaşlı erişkinlerde bilişsel bozuklukları tespit etmek için kullanılır ve dikkat, bellek, dil, uzamsal beceriler ve yürütücü işlevler gibi yetenekleri değerlendirir.

Uzamsal Becerilerde Zorluklar

Tüm yapay zeka modelleri, uzamsal beceriler ve yürütücü işlevlerde düşük performans gösterdi. Özellikle Gemini modelleri, belirli testlerde zorluklar yaşadı. Ancak, diğer yeteneklerde, örneğin adlandırma, dikkat, dil ve soyutlama gibi alanlarda iyi bir performans sergilediler.

Bu çalışma, yapay zekanın bilişsel yeteneklerinin değerlendirilmesinde önemli bir adımı temsil ediyor ve yapay zeka modellerinin insan benzeri zorluklarla nasıl başa çıktığını anlamak için değerli bir bakış sunuyor.