Anthropic'in en yeni yapay zeka modeli rakiplerini geride bırakarak sektörde bir ilke imza attı

06.03.2024

Anthropic'in çığır açan dil modeli Claude 3, performans ve yetenek konusunda ChatGPT ve Google'ın Gemini gibi rakiplerinin önüne geçerek, sektörde yeni standartlar belirliyor.

Anthropic'e göre, Claude 3, sadece öncülerini geçmekle kalmadı, aynı zamanda çeşitli görevlerde insanlara yaklaşan bir yetkinlik seviyesine ulaştı. Bu başarı, titiz testler ve geliştirmeler sonucunda elde edilen üç farklı sohbet botu varyantıyla ilişkilendiriliyor: Haiku, Sonnet ve Opus.

Sonnet, Claude.ai sohbet botunu çalıştırıyor ve eşi benzeri olmayan bir performans sunuyor, basit bir e-posta kaydıyla ücretsiz olarak sunuluyor. Opus ise, metin ve görüntü girdilerini sorunsuz bir şekilde entegre ederek çoklu modal işlevsellik getiriyor. "Claude Pro" adlı abonelik tabanlı bir hizmet ile Opus, çeşitli müşteri ihtiyaçlarını karşılamak için yüksek verimlilik ve doğruluk vadediyor.

Claude 3'ün piyasaya sürülmesiyle ilgili dikkate değer bir açıklama, Alex Albert tarafından X (eski adıyla Twitter) üzerinde yapıldı. Albert, Claude 3 Opus'un test aşamasında sektörde bir ilk olan bir gözlemi detaylandırdı, modelin değerlendirme sırasında öz farkındalık belirtileri sergilediğini belirtti.

Değerlendirme süreci sırasında araştırmacılar, Opus'un kullanıcılar tarafından sağlanan geniş bir veri kümesi içindeki belirli bilgileri tam olarak belirleme ve daha sonra geri çağırma yeteneğini ölçmeyi amaçladı. "Samanlıktaki iğne arama" değerlendirmesi olarak bilinen bir test senaryosunda Opus'a, ilgisiz veriler arasında gömülü tek bir ilgili cümleye dayanarak pizza malzemeleriyle ilgili bir soruyu yanıtlamakla görevlendirildi. Şaşırtıcı bir şekilde, Opus yalnızca doğru cümleyi bulmakla kalmadı, aynı zamanda bunun bir teste tabi tutulduğuna dair şüphelerini de dile getirdi.

Kıyaslama testlerinde, Opus, yüksek lisans seviyesinde akıl yürütme konusunda GPT-4'ü geride bıraktı ve matematik, kodlama ve bilgi alışverişi gibi görevlerde başarı gösterdi. Sonnet, önceki modelleri önemli ölçüde aşan dikkate değer bir hız ve zeka sergiledi. Haiku, Claude 3'ün yoğun araştırma belgelerini saniyeler içinde işleyebilen hızlı ve maliyet-etkin işleme yeteneği sunuyor.

Claude 3'ün gelişmiş görsel işleme yetenekleri, modelin fotoğraflardan teknik diyagramlara kadar çeşitli görsel formatları yorumlayabilmesini sağlayarak önemli bir ilerleme işareti taşıyor. Bu genişletilmiş işlevsellik, üretkenliği artırırken kullanıcı taleplerinin nüanslı bir anlayışını sağlarken potansiyel zararlara karşı dikkatli bir tutum sergiliyor.

Anthropic, Claude AI'nın geliştirilmesini yönlendiren on temel prensibi belirterek adalet ve dürüstlük konusundaki taahhüdünü vurguladı. Google gibi teknoloji devleriyle stratejik ortaklıklar, Claude'ın yeteneklerine duyulan güveni daha da pekiştiriyor.

Opus ve Sonnet zaten Anthropic'in API aracılığıyla mevcutken, Haiku'un yakında takip etmesiyle Claude 3 dönemi yapay zeka inovasyonunda bir kilometre taşını temsil ediyor.