2018 yılında Hawaii çevresinde yapılan bir araştırma gezisinde, Yuening Zhang SM ’19, PhD ’24, ekip üyeleri arasında kesintisiz koordinasyonu sağlamanın ne kadar zor olduğunu gözlemledi. Su altı arazisinin haritalandırılması, kesin bir senkronizasyon gerektiriyordu, ancak koşullardaki ani değişiklikler, ekip üyelerinin tamamlanması gereken görevler konusunda farklı anlayışlara sahip olmasıyla, bazen karışıklık ve strese yol açıyordu. Zhang, bir robotik asistanın, kendisinin ve ekip arkadaşlarının hedeflerine daha etkili bir şekilde ulaşmalarına nasıl yardımcı olabileceğini düşünmeye başladı.
Altı yıl sonra, MIT Bilgisayar Bilimi ve Yapay Zeka Laboratuvarı'nda (CSAIL) araştırma asistanı olarak Zhang, bu zorluğu ele alan bir çözüm geliştirdi: Ekip üyeleriyle iletişim kurmak, rollerini uyumlu hale getirmek ve ortak hedeflere ulaşmalarına yardımcı olmak için tasarlanmış bir yapay zeka asistanı. Zhang ve meslektaşları, 8 Ağustos'ta IEEE Xplore'da yayınlanan ve Uluslararası Robotik ve Otomasyon Konferansı'nda (ICRA) sunulan bir makalede, insan ve yapay zeka ajanlarından oluşan bir ekibi denetleyebilen ve arama kurtarma görevleri, tıbbi prosedürler ve strateji video oyunları gibi alanlarda ekip çalışmasını artırmak için gerektiğinde müdahale edebilen bir sistem tanıttılar.
CSAIL liderliğindeki ekip, yapay zeka ajanları için bir zihin teorisi modeli geliştirdi ve bu model, insanların bir görevde iş birliği yaparken birbirlerinin eylemlerini nasıl algıladığını ve tahmin ettiğini simüle ediyor. Bu yeni ekip koordinatörü, diğer ajanların eylemlerini gözlemleyerek, planlarını ve birbirleri hakkındaki anlayışlarını önceden tanımlanmış bir inanç setine dayalı olarak çıkarabilir. Planlar arasında bir uyumsuzluk tespit ettiğinde, yapay zeka asistanı, ajanların inançlarını uyumlu hale getirerek, eylemlerini yönlendirerek ve gerektiğinde sorular sorarak müdahale eder.
Örneğin, bir arama kurtarma senaryosunda, kurtarma ekipleri, birbirlerinin rolleri ve ilerlemeleri hakkındaki anlayışlarına dayalı olarak kararlar almak zorundadır. CSAIL'in yazılımı, her ajanın diğerlerinin ne yaptığını veya ne yapmayı planladığını bilmesini sağlamak için mesajlar göndererek bu karar alma sürecini iyileştirebilir, böylece görevlerin tekrarlanmasından kaçınılır ve tamamlanması sağlanır. Yapay zeka asistanı, ekibin bir ajanın belirli bir alana zaten girdiğini veya hiçbir ajanın potansiyel kurbanların bulunduğu bir bölgeyi kapsamadığını bildirmek için müdahale edebilir.
“Çalışmamız, ‘Senin, başka birinin neye inandığına inandığını düşünüyorum’ kavramını ele alıyor” diyor şu anda Mobi Systems'te araştırma bilimcisi olarak çalışan Zhang. “Bir ekipte çalıştığınızı hayal edin ve kendinize ‘O kişi tam olarak ne yapıyor? Sıradaki görevim ne olmalı? Benim ne yapacağımı biliyor mu?’ diye soruyorsunuz. Farklı ekip üyelerinin genel planı nasıl anladığını ve ekibin ortak hedefine ulaşmalarına yardımcı olmak için ne yapmaları gerektiğini modelleyerek iletişim kurmalarını sağlıyoruz.”
Yapay Zeka Yardımcı Oluyor
Net bir planla bile, hem insan hem de robotik ajanlar, rollerinin net olmadığı durumlarda karışıklık yaşayabilir ve hata yapabilir. Bu sorun, zaman sınırlı ve geniş arama alanları gibi büyük zorluklarla karşılaşılan arama kurtarma görevlerinde özellikle kritik hale gelir. Yeni robotik asistan, geliştirilmiş iletişim teknolojisi ile donatılmış olarak, arama ekiplerine her grubun ne yaptığını ve nerede bulunduğunu bildirerek, alanı daha verimli bir şekilde taramalarına yardımcı olabilir.
Bu tür görev organizasyonu, tıbbi ortamlarda, örneğin cerrahi müdahalelerde de faydalı olabilir. Bu durumlarda, yapay zeka ekip koordinatörü, operasyonu denetleyerek ekibin iyi organize olmasını sağlar ve herhangi bir görevde karışıklık ortaya çıktığında müdahale eder.
Etkili ekip çalışması, "Valorant" gibi video oyunlarında da önemlidir, burada oyuncular, başka bir takıma karşı saldırı veya savunma eylemlerini koordine etmelidir. Bu senaryolarda, yapay zeka asistanı, oyuncuların görevlerini yanlış anladıklarında onları uyarabilir.
Bu modeli geliştirmeden önce Zhang, bir ekip üyesi olarak hareket eden EPike adlı bir hesaplama modeli tasarladı. 3D bir simülasyon programında bu algoritma, bir insan tarafından seçilen içeceği doğru bir kapla eşleştirmesi gereken bir robotik ajanı kontrol etti. AI ile simüle edilmiş botlar ne kadar rasyonel ve sofistike olursa olsun, yine de insan partnerleri veya görev hakkında yanlış algılarla sınırlanabilirler. Yeni AI koordinatörü, gerektiğinde ajanların inançlarını düzelterek görevlerin doğru bir şekilde tamamlanmasını sağlar. Örneğin, sistem, robotun doğru kabı seçmesini sağlamak için insana ilişkin gerçek niyetlerle ilgili mesajlar gönderebilir.
“İnsan-robot iş birliği konusundaki çalışmalarımızda, insan partnerlerinin ne kadar akıcı olduğundan hem etkilenmiş hem de ilham almış bulunmaktayız,” diyor MIT Havacılık ve Uzay Bilimleri profesörü, CSAIL üyesi ve çalışmanın kıdemli yazarı Brian C. Williams. “Örneğin, çocukları olan genç bir çifti ele alalım, kahvaltıyı hazırlamak ve çocukları okula göndermek için sessiz bir iş birliği içinde çalışırlar. Bir ebeveyn, diğerinin hala sabahlığında kahvaltı hazırladığını görürse, hızlıca duş alıp çocukları okula götürmeleri gerektiğini bilerek tek kelime bile etmez. İyi partnerler, birbirlerinin inançlarına ve hedeflerine iyi uyum sağlar ve epistemik planlama üzerine yaptığımız çalışma, bu tür bir düşünme tarzını yakalamayı amaçlıyor.”
Araştırmacıların yöntemi, yapay zeka asistanının risk sınırlandırılmış kararlar almasını sağlamak için olasılıksal akıl yürütmeyi, ajanların zihinsel modellemesinde yinelemeli bir şekilde entegre eder. Ayrıca, çevreyle ilgili mevcut inançları modellemeye yönelik önceki çalışmaları tamamlayacak şekilde, planlar ve eylemler konusundaki ajanların anlayışını modellemeye odaklandılar. Yapay zeka asistanı şu anda olası inançların önceden belirlenmiş bir setine dayalı olarak ajanların inançlarını çıkarıyor, ancak MIT ekibi, gerçek zamanlı olarak yeni hipotezler oluşturmak için makine öğrenimi tekniklerini uygulamayı planlıyor. Bu çalışmayı gerçek hayattaki görevlere uygulamak için, daha zengin plan temsilcilerini dikkate almayı ve hesaplama maliyetlerini daha da azaltmayı hedefliyorlar.
Dynamic Object Language Labs Başkanı Paul Robertson, Johns Hopkins Üniversitesi Yardımcı Doçenti Tianmin Shu ve eski CSAIL üyesi Sungkweon Hong PhD ’23, Zhang ve Williams ile birlikte bu makalede çalıştı. Çalışmaları, kısmen ABD Savunma İleri Araştırma Projeleri Ajansı (DARPA) Yapay Sosyal Zeka için Başarılı Ekipler (ASIST) programı tarafından desteklendi.