The BMJ dergisinde yayımlanan bir araştırmaya göre, ChatGPT 4, Claude 3.5 ve Gemini gibi popüler yapay zeka modelleri, Montreal Bilişsel Değerlendirme Testi’nde (MoCA) düşük puanlar aldı. Bu test, dikkat, hafıza, dil, görsel-uzamsal beceriler ve yürütücü işlevler gibi bilişsel yetileri ölçmek için kullanılıyor.
Çalışma, tıpkı yaşlanan insan hastalar gibi, daha eski yapay zeka modellerinin de testlerde daha düşük performans gösterdiğini ortaya koydu. Yazarlar, bu bulguların yapay zekanın insan doktorların yerini alacağı düşüncesini sorgulattığını öne sürüyor.
Son dönemdeki yapay zeka gelişmeleri, sohbet robotlarının tıp alanındaki görevlerde insan doktorları geçip geçemeyeceği konusunda hem heyecan hem de endişe uyandırdı. Önceki çalışmalar, büyük dil modellerinin çeşitli tıbbi teşhis görevlerinde başarılı olduğunu gösterse de, bilişsel bozukluklara karşı olası kırılganlıklar şimdiye kadar pek araştırılmamıştı.
Araştırmacılar, ChatGPT 4, ChatGPT 4o, Claude 3.5 ve Gemini 1, Gemini 1.5 gibi büyük dil modellerini, Montreal Bilişsel Değerlendirme (MoCA) testi üzerinde değerlendirdiler. Bu test, genellikle yaşlı erişkinlerde bilişsel bozuklukları tespit etmek için kullanılır ve dikkat, bellek, dil, uzamsal beceriler ve yürütücü işlevler gibi yetenekleri değerlendirir.
Tüm yapay zeka modelleri, uzamsal beceriler ve yürütücü işlevlerde düşük performans gösterdi. Özellikle Gemini modelleri, belirli testlerde zorluklar yaşadı. Ancak, diğer yeteneklerde, örneğin adlandırma, dikkat, dil ve soyutlama gibi alanlarda iyi bir performans sergilediler.
Bu çalışma, yapay zekanın bilişsel yeteneklerinin değerlendirilmesinde önemli bir adımı temsil ediyor ve yapay zeka modellerinin insan benzeri zorluklarla nasıl başa çıktığını anlamak için değerli bir bakış sunuyor.
Reklam & İşbirliği: [email protected]