OpenAI, insan zekasını aşan yapay zeka (YZ) geliştirmeye yönelik bir taahhüt ile kurulmuş olup, bu yapay zeka, insan zekasını geçse bile insanlığın genel yararına hizmet etmeyi amaçlamaktadır. Son zamanlardaki ticari odaklanmaya rağmen, özellikle ChatGPT'nin tanıtılmasıyla, şirket, giderek daha güçlenen YZ'lerin ortaya çıkardığı zorluklarla başa çıkmaya odaklıdır. Temmuz ayında kurulan Superalignment araştırma ekibi, beklenen şekilde önemli yeteneklere ve potansiyel risklere sahip olacak gelecekteki süper insanüstü YZ varlıklarını yönetme stratejileri üzerinde aktif olarak çalışmaktadır.
OpenAI'ın Superalignment projesinde yer alan araştırmacı Leopold Aschenbrenner, Yapay Genel Zeka'nın (YGZ) hızla yaklaştığını ve etkili kontrol yöntemlerine olan ihtiyacı vurgulamaktadır. OpenAI, bu kritik araştırma girişimine önemli bir bilgi işlem gücü tahsis etmiştir.
Yeni yayımlanan bir araştırma makalesinde, OpenAI, daha az gelişmiş bir yapay zeka modelinin davranışını daha zeki bir modele rehberlik etmeyi amaçlayan deneyleri detaylandırıyor, ancak bu sırada ikinci modelin yeteneklerini zayıflatmıyor. Çalışma, şu anda GPT-4 gibi modellerin performansını artırmak için insan geri bildirimini içeren denetim sürecine odaklanmaktadır. Yapay zeka ilerledikçe, insan girişinin potansiyel sınırlamaları göz önüne alınarak bu geri bildirim döngüsünün otomatikleştirilmesine yönelik artan bir ilgi bulunmaktadır.
Araştırmacılar, başlangıçta üstün modelin yeteneklerinde bir azalmaya neden olan GPT-2'yi kullanarak GPT-4'ü eğitmek için bir kontrol deneyimi gerçekleştirdiler. İki önerilen çözüm test edildi: performans kaybını hafifletmek için aşamalı olarak daha büyük modelleri eğitmek ve GPT-4'e, zayıf modelin rehberliğini dikkate almasına olanak tanıyan bir algoritmik ayarlama uygulamak. İkincisi daha etkili oldu, ancak araştırmacılar, bu yöntemlerin daha güçlü modelin hatasız davranışını garanti etmediğini kabul ederek, bunu gelecekteki araştırmalar için bir ön adım olarak değerlendirdiler.
Yapay Zeka Güvenliği Merkezi Direktörü Dan Hendryks, OpenAI'nın süper insanüstü Yapay Zekaları kontrol etme zorluklarına karşı proaktif yaklaşımını takdirle karşılıyor ve bu karmaşık konuyu başarılı bir şekilde ele alabilmek için birçok yıl boyunca sürdürülen, özverili çabaların gerekliliğine vurgu yapıyor.