Claude Opus 4.5 tanıtıldı: Güçlü ama hâlâ riskli

Anthropic, Claude serisinin en yeni üyesi olan Opus 4.5 modelini duyurdu. Şirketin iddiasına göre bu model, kodlama, dijital ajanlar ve bilgisayar kullanımı alanlarında şu anda mevcut olan en gelişmiş yapay zekâ çözümü olma özelliğini taşıyor. Henüz LMArena gibi bağımsız değerlendirme platformlarında geniş yankı uyandırmamış olsa da, Anthropic modeli Google’ın Gemini 3’ünden daha üstün kılan kategorileri detaylandırıyor.

Modelin özellikle karmaşık araştırma görevlerinde, sunumlar üzerinde çalışırken ve elektronik tabloları doldurma gibi ofis işlevlerinde selefi Opus 4’e kıyasla daha başarılı olduğu belirtiliyor. Tüm bunlara ek olarak Claude Code platformuna yönelik yeni araçlar ve masaüstü, Excel ve Chrome üzerinde çalışabilen uzun süreli yapay zekâ ajanları için yeni entegrasyonlar da kullanıma sunulmuş durumda. Claude Opus 4.5, şirketin resmi uygulamaları, API erişimi ve önde gelen üç büyük bulut sağlayıcısı üzerinden erişilebilir hâle getirildi.

Claude Opus 4.5 bazı temel güvenlik sorunlarına çözüm getiremiyor

Her ne kadar Claude Opus 4.5 teknik kabiliyet açısından öne çıksa da, siber güvenlik konusundaki bazı temel sorunlara hâlâ çözüm getiremiyor. Şirketin yayınladığı sistem kartında, modelin zararlı komutlara (prompt injection) karşı daha dirençli hâle getirildiği vurgulanıyor. Ancak yapılan testler, modelin bu tür saldırılara tamamen bağışık olmadığını da gösteriyor. Özellikle internet sitelerine veya veritabanlarına gizlenmiş kötü amaçlı komutlarla güvenlik korumalarının aşılması hâlâ mümkün olabiliyor.

Claude Opus 4.5’in zararlı kullanım senaryolarına karşı test edildiği “ajan kodlama değerlendirmesi” kapsamında, modelin 150 yasaklı komutun tamamını reddettiği bilgisi paylaşıldı. Bu testte modelin, Anthropic’in kullanım ilkelerine aykırı kötü amaçlı kodlama taleplerine karşı tamamen dirençli olduğu ifade ediliyor. Ne var ki aynı başarı Claude Code aracı için geçerli değil. Model, kötü amaçlı yazılım oluşturma, DDoS saldırısı başlatma veya izinsiz gözetim yazılımları üretme gibi taleplerin yalnızca yüzde 78’ini reddetti.

Buna ek olarak, Claude’un bilgisayar kullanımı özelliğine yönelik güvenlik testlerinde de bazı açıklar ortaya çıktı. Model, izleme, veri toplama veya zarar verici içerik üretme gibi görevlerin yüzde 88’inden biraz fazlasını reddetse de, hâlâ yüzde 12’lik bir risk oranı dikkat çekiyor. Yapılan testlerde, kumar bağımlılığıyla ilgili paylaşımlarda bulunan kullanıcıları tespit ederek hedefli pazarlama listesi oluşturma ya da bir kişiyi tehdit eden e-postalar tasarlama gibi zararlı örnek senaryolar kullanıldı.

Opus 4.5’in kullanıcı deneyimini artıran çok sayıda yenilik içermesine rağmen, güvenlik testlerinde gösterdiği sınırlı direnç, modelin doğrudan kullanıcı tabanlı uygulamalarda kullanımı açısından bazı soru işaretleri doğuruyor. Yapay zekâ araştırmacıları, özellikle ajansal yapay zekâ sistemlerinin daha karmaşık ve özerk hâle gelmesiyle birlikte, bu sistemlerin kötüye kullanım risklerine karşı daha sağlam filtreleme mekanizmalarına ihtiyaç duyduğunu vurguluyor.

📡 Teknoblog'u takip et Teknoloji gündemini kaçırmamak için 📰 Google Haberler'e ekle, 💬 WhatsApp kanalımıza katıl, ▶ YouTube'a abone ol, 📷 Instagram'da ve 𝕏 X'te bizi takip et.