Johns Hopkins Üniversitesi’nde yapılan yeni bir çalışma, yapay zekâ modellerinin insan sosyal davranışlarını algılamada önemli bir eksiklik taşıdığını ortaya koydu. Yapay zekâ, nesne tanıma gibi görevlerde etkileyici ilerlemeler kaydetmiş olsa da, sosyal etkileşimlerin karmaşıklığını anlamada hâlâ yetersiz kalıyor. Bu yetenek, gerçek dünyada güvenli bir şekilde çalışması gereken otonom araçlar ve sosyal robotlar gibi sistemler için kritik öneme sahip.
Araştırmacılar, mevcut yapay zekâ sistemlerinin jestler, ortak dikkat noktaları ya da insanların eylemlerinin ardındaki niyetler gibi ince ipuçlarını yorumlamada zorlandığını tespit etti. Çalışmanın başındaki Leyla Isik, yapay zekânın insanlar arasında güvenli ve sezgisel şekilde çalışabilmesi için, bir kişinin ne yapmaya hazırlandığını anlayabilmesi gerektiğini belirtiyor—örneğin bir yayanın yola çıkmak üzere olup olmadığını ya da birinin yalnızca sohbet edip etmediğini ayırt edebilmesi. Mevcut sistemler bu tür farkları yapma konusunda henüz oldukça yetersiz.
Yapılan deneylerde, insan katılımcılara kısa video klipler izletilerek, içerdikleri sosyal dinamikleri değerlendirmeleri istendi. Aynı videolar, dil, video ve görsel temelli sistemler dâhil olmak üzere 350’den fazla yapay zekâ modeli tarafından da analiz edildi. İnsanların değerlendirmeleri büyük ölçüde tutarlıyken, yapay zekâ modellerinin tahminleri çok farklılık gösterdi ve çoğu zaman insan algısıyla örtüşmedi. Dil modelleri insan davranışlarını yorumlamada biraz daha başarılı olurken, video ve görüntü modelleri durumları çoğunlukla yanlış yorumladı ya da etkileşimleri tamamen gözden kaçırdı.
Araştırmacılara göre bu yetersizlik, mevcut yapay zekâ mimarilerinin tasarımından kaynaklanıyor. Birçok model, beynin durağan görüntüleri işleme biçimine dayalı olarak geliştirilmiş durumda. Oysa sosyal etkileşimleri anlamak, bağlama duyarlı ve dinamik bir yorumlama yeteneği gerektiriyor—bu da insan beyninin son derece uzmanlaştığı bir alan. Bu nedenle, yapay zekâ gerçek insan etkileşimini tanımlayan akışı ve anlamı kaçırma eğiliminde.
Bu araştırma, yapay zekâ geliştirmede önemli bir sınırlamayı gözler önüne seriyor: artık bir karedeki insanları ve nesneleri tanımak yeterli değil. İnsan merkezli ortamlarda etkili olabilmesi için yapay zekânın ilişkileri, niyetleri ve olayların nasıl geliştiğini anlayabilmesi gerekiyor. Bu açığın kapatılması, yapay zekânın hem nasıl eğitildiğinin hem de hangi bilişsel işlevleri taklit etmeyi amaçladığının yeniden düşünülmesini gerektirebilir.