Claude Opus 4.5 tanıtıldı: Güçlü ama hâlâ riskli

Anthropic, Claude serisinin en yeni üyesi olan Opus 4.5 modelini duyurdu. Şirketin iddiasına göre bu model, kodlama, dijital ajanlar ve bilgisayar kullanımı alanlarında şu anda mevcut olan en gelişmiş yapay zekâ çözümü olma özelliğini taşıyor. Henüz LMArena gibi bağımsız değerlendirme platformlarında geniş yankı uyandırmamış olsa da, Anthropic modeli Google’ın Gemini 3’ünden daha üstün kılan kategorileri detaylandırıyor.

Modelin özellikle karmaşık araştırma görevlerinde, sunumlar üzerinde çalışırken ve elektronik tabloları doldurma gibi ofis işlevlerinde selefi Opus 4’e kıyasla daha başarılı olduğu belirtiliyor. Tüm bunlara ek olarak Claude Code platformuna yönelik yeni araçlar ve masaüstü, Excel ve Chrome üzerinde çalışabilen uzun süreli yapay zekâ ajanları için yeni entegrasyonlar da kullanıma sunulmuş durumda. Claude Opus 4.5, şirketin resmi uygulamaları, API erişimi ve önde gelen üç büyük bulut sağlayıcısı üzerinden erişilebilir hâle getirildi.

Claude Opus 4.5 bazı temel güvenlik sorunlarına çözüm getiremiyor

Her ne kadar Claude Opus 4.5 teknik kabiliyet açısından öne çıksa da, siber güvenlik konusundaki bazı temel sorunlara hâlâ çözüm getiremiyor. Şirketin yayınladığı sistem kartında, modelin zararlı komutlara (prompt injection) karşı daha dirençli hâle getirildiği vurgulanıyor. Ancak yapılan testler, modelin bu tür saldırılara tamamen bağışık olmadığını da gösteriyor. Özellikle internet sitelerine veya veritabanlarına gizlenmiş kötü amaçlı komutlarla güvenlik korumalarının aşılması hâlâ mümkün olabiliyor.

İLGİNİZİ ÇEKEBİLİR

Claude Opus 4.5’in zararlı kullanım senaryolarına karşı test edildiği “ajan kodlama değerlendirmesi” kapsamında, modelin 150 yasaklı komutun tamamını reddettiği bilgisi paylaşıldı. Bu testte modelin, Anthropic’in kullanım ilkelerine aykırı kötü amaçlı kodlama taleplerine karşı tamamen dirençli olduğu ifade ediliyor. Ne var ki aynı başarı Claude Code aracı için geçerli değil. Model, kötü amaçlı yazılım oluşturma, DDoS saldırısı başlatma veya izinsiz gözetim yazılımları üretme gibi taleplerin yalnızca yüzde 78’ini reddetti.

Buna ek olarak, Claude’un bilgisayar kullanımı özelliğine yönelik güvenlik testlerinde de bazı açıklar ortaya çıktı. Model, izleme, veri toplama veya zarar verici içerik üretme gibi görevlerin yüzde 88’inden biraz fazlasını reddetse de, hâlâ yüzde 12’lik bir risk oranı dikkat çekiyor. Yapılan testlerde, kumar bağımlılığıyla ilgili paylaşımlarda bulunan kullanıcıları tespit ederek hedefli pazarlama listesi oluşturma ya da bir kişiyi tehdit eden e-postalar tasarlama gibi zararlı örnek senaryolar kullanıldı.

$Grundig 75 GQ 700A 75\" 190 Ekran 4K Ultra HD Google Smart QLED TV$

Grundig 75 GQ 700A 75\" 190 Ekran 4K Ultra HD Google Smart QLED TV

Satın Al

$MSI CYBORG 15 A13UC-2087XTR Intel Core i5 13420H 16GB 512GB SSD RTX3050 Freedos 15.6\" FHD 144Hz Taşınabilir Bilgisayar$

MSI CYBORG 15 A13UC-2087XTR Intel Core i5 13420H 16GB 512GB SSD RTX3050 Freedos 15.6\" FHD 144Hz Taşınabilir Bilgisayar

Satın Al

Samsung Windfree Premium AR60F12C1KW/SK A++ 12000 Btu Inverter Duvar Tipi Klima

Satın Al

Arçelik 9120 Dmx 1200 Devir 9 kg Çamaşır Makinesi

Satın Al

Beko 970471 MB Üstten Donduruculu Buzdolabı

Satın Al

Duracell 18W Araç Şarj Aleti Çakmaklık Type-C PD + USB-A – Çift Çıkışlı Hızlı Şarj Cihazı

Satın Al

Tümünü Gör Daralt

Tüm Fırsatları Gör

Teknoblog'un satış ortaklıkları vardır. Bunlar, editoryal içeriği etkilemez, ancak Teknoblog, satış ortaklığı bağlantıları üzerinden satın alınan ürünler için komisyon kazanabilir.

Opus 4.5’in kullanıcı deneyimini artıran çok sayıda yenilik içermesine rağmen, güvenlik testlerinde gösterdiği sınırlı direnç, modelin doğrudan kullanıcı tabanlı uygulamalarda kullanımı açısından bazı soru işaretleri doğuruyor. Yapay zekâ araştırmacıları, özellikle ajansal yapay zekâ sistemlerinin daha karmaşık ve özerk hâle gelmesiyle birlikte, bu sistemlerin kötüye kullanım risklerine karşı daha sağlam filtreleme mekanizmalarına ihtiyaç duyduğunu vurguluyor.

Teknoblog artık WhatsApp'taGünün en iyi teknoloji fırsatları ve kaçırmamanız gereken büyük haberler, telefonunuza gelsin.

Kanala Katıl