Teknoloji

Anthropic, Claude Opus 4.5 ile yapay zekâ yarışında öne çıkıyor; ancak güvenlik açıkları sürüyor

Anthropic, Claude Opus 4.5 ile yapay zekâ yarışında öne çıkıyor; ancak güvenlik açıkları sürüyor
Haberleri Kaçırma! Teknoblog'u Google Arama'da tercihli kaynağın yap ve En Çok Okunan Haberler'de bizi daha sık gör.
Tercihli Kaynak Ekle

Anthropic, Claude serisinin en yeni üyesi olan Opus 4.5 modelini duyurdu. Şirketin iddiasına göre bu model, kodlama, dijital ajanlar ve bilgisayar kullanımı alanlarında şu anda mevcut olan en gelişmiş yapay zekâ çözümü olma özelliğini taşıyor. Henüz LMArena gibi bağımsız değerlendirme platformlarında geniş yankı uyandırmamış olsa da, Anthropic modeli Google’ın Gemini 3’ünden daha üstün kılan kategorileri detaylandırıyor.

Modelin özellikle karmaşık araştırma görevlerinde, sunumlar üzerinde çalışırken ve elektronik tabloları doldurma gibi ofis işlevlerinde selefi Opus 4’e kıyasla daha başarılı olduğu belirtiliyor. Tüm bunlara ek olarak Claude Code platformuna yönelik yeni araçlar ve masaüstü, Excel ve Chrome üzerinde çalışabilen uzun süreli yapay zekâ ajanları için yeni entegrasyonlar da kullanıma sunulmuş durumda. Claude Opus 4.5, şirketin resmi uygulamaları, API erişimi ve önde gelen üç büyük bulut sağlayıcısı üzerinden erişilebilir hâle getirildi.

Claude Opus 4.5 bazı temel güvenlik sorunlarına çözüm getiremiyor

Her ne kadar Claude Opus 4.5 teknik kabiliyet açısından öne çıksa da, siber güvenlik konusundaki bazı temel sorunlara hâlâ çözüm getiremiyor. Şirketin yayınladığı sistem kartında, modelin zararlı komutlara (prompt injection) karşı daha dirençli hâle getirildiği vurgulanıyor. Ancak yapılan testler, modelin bu tür saldırılara tamamen bağışık olmadığını da gösteriyor. Özellikle internet sitelerine veya veritabanlarına gizlenmiş kötü amaçlı komutlarla güvenlik korumalarının aşılması hâlâ mümkün olabiliyor.

Claude Opus 4.5’in zararlı kullanım senaryolarına karşı test edildiği “ajan kodlama değerlendirmesi” kapsamında, modelin 150 yasaklı komutun tamamını reddettiği bilgisi paylaşıldı. Bu testte modelin, Anthropic’in kullanım ilkelerine aykırı kötü amaçlı kodlama taleplerine karşı tamamen dirençli olduğu ifade ediliyor. Ne var ki aynı başarı Claude Code aracı için geçerli değil. Model, kötü amaçlı yazılım oluşturma, DDoS saldırısı başlatma veya izinsiz gözetim yazılımları üretme gibi taleplerin yalnızca yüzde 78’ini reddetti.

Buna ek olarak, Claude’un bilgisayar kullanımı özelliğine yönelik güvenlik testlerinde de bazı açıklar ortaya çıktı. Model, izleme, veri toplama veya zarar verici içerik üretme gibi görevlerin yüzde 88’inden biraz fazlasını reddetse de, hâlâ yüzde 12’lik bir risk oranı dikkat çekiyor. Yapılan testlerde, kumar bağımlılığıyla ilgili paylaşımlarda bulunan kullanıcıları tespit ederek hedefli pazarlama listesi oluşturma ya da bir kişiyi tehdit eden e-postalar tasarlama gibi zararlı örnek senaryolar kullanıldı.

Opus 4.5’in kullanıcı deneyimini artıran çok sayıda yenilik içermesine rağmen, güvenlik testlerinde gösterdiği sınırlı direnç, modelin doğrudan kullanıcı tabanlı uygulamalarda kullanımı açısından bazı soru işaretleri doğuruyor. Yapay zekâ araştırmacıları, özellikle ajansal yapay zekâ sistemlerinin daha karmaşık ve özerk hâle gelmesiyle birlikte, bu sistemlerin kötüye kullanım risklerine karşı daha sağlam filtreleme mekanizmalarına ihtiyaç duyduğunu vurguluyor.

Bu fırsatlar ilginizi çekebilir

Samsung Galaxy S25 Ultra 512 GB - %0 Faizli 3 Taksit Fırsatı
Xiaomi 17T Serisi Lansmana Özel Fırsatlarla Burada!
Lenovo Idea Tab Plus 8gb 256GB 12.1\" 2.5k 600NITS Tablet+Kalem+Kılıf ZAG70130TR
HONOR Pad X9A 8gb 256GB Wi-Fi 11.5 Inç IPS Uzay Gri Tablet -Uzay Grisi
Huawei Yeni (2025) Matepad 12X 12.0\" Papermatte Edition 12GB 256GB Yeşil + Klavye
Xiaomi Smart Band 10 Ceramic Edition Pearl White Akıllı Bileklik

Teknoblog'un satış ortaklıkları vardır. Bunlar, editoryal içeriği etkilemez, ancak Teknoblog, satış ortaklığı bağlantıları üzerinden satın alınan ürünler için komisyon kazanabilir.