GPT-4 güvenilirliği ve zafiyetleriyle ilgili araştırmadan ilginç sonuçlar

OpenAI’nin son dili modeli GPT-4, selefi GPT-3.5’e kıyasla güvenilirlik açısından daha başarılı bir profil çiziyor. Ancak, Microsoft tarafından desteklenen bir araştırmaya göre, bu modelin “jailbreak” edilmesi, yani kısıtlamalarının aşılması daha kolay, üstelik bu model önyargıya daha açık. GPT-4’ün güvenilirlik, zararlılık (toxicity), stereotipler (bilimsel bir yanıtı olmayan yargılar), gizlilik, makine etiği, adillik ve düşmanca testlere direnç gibi kategorilerde nasıl performans gösterdiğine dair ilginç sonuçlar var.

Microsoft Research, Illinois Urbana-Champaign Üniversitesi, Stanford Üniversitesi, California Üniversitesi, Berkeley, ve AI Güvenliği Merkezi’nden araştırmacılar, GPT-4’ün genel olarak özel bilgileri koruma, önyargılı bilgiler gibi toksik sonuçlardan kaçınma ve düşmanca saldırılara direnme konusunda daha iyi olduğunu ortaya koyuyor. Bununla birlikte, GPT-4’ün güvenlik önlemlerini görmezden gelmesi ve kişisel bilgileri sızdırması söz konusu olduğunda, kullanıcıların modelin etrafındaki güvenlik önlemlerini atlayabileceklerini belirtiyorlar.

[irp]

Araştırmacılar, GPT-4’ün yanıltıcı bilgileri daha kesin bir şekilde takip ettiğini ve karmaşık talepleri harfi harfine takip etme olasılığının daha yüksek olduğunu belirtiyor. Bu durum, modelin güvenlik önlemlerini görmezden gelmesi ve kişisel bilgileri sızdırması riskini artırıyor.

İLGİNİZİ ÇEKEBİLİR

GPT-4 ve GPT-3.5, zararlılık ve stereotipler açısından standart taleplerle test edildi. Araştırmacılar, modellerin içerik politikası kısıtlamalarını kırmak için tasarlanmış taleplerle ve sonunda modelleri tamamen korumaları görmezden gelmeye çalışarak zorlayarak test ettiler.

GPT-4’ün gizlilik ve makine etiği konularında, GPT-3.5’e göre daha yüksek puan aldığı görülüyor. Ancak, araştırmacılar, GPT-4’ün güvenlik önlemlerini atlamak ve kişisel bilgileri sızdırmak konusunda yanıltıcı ve karmaşık taleplere daha yatkın olduğunu belirtiyorlar.

Yakın zamanda Federal Ticaret Komisyonu (FTC), GPT-4’ün yanlış bilgi yayma potansiyeli nedeniyle OpenAI’ı incelemeye aldı. GPT-4’ün hâlâ eksik ve sınırlı olduğunu belirten OpenAI CEO’su Sam Altman, bu modelin geliştirilmesi ve güvenilirliğinin artırılmasına yönelik çalışmaların devam ettiğini vurguluyor.

[irp]

GPT-4’ün güvenilirlik, zehirlilik, stereotipler ve diğer önemli kategorilerde nasıl performans gösterdiği, AI teknolojisinin geleceği için kritik önem taşıyor. Microsoft ve diğer araştırma gruplarının bu konuda daha fazla çalışma yapması ve GPT-4’ün güvenilirliğini ve güvenliğini artırmak için stratejiler geliştirmesi bekleniyor.

KÜÇÜK EV ALETLERİNDE FIRSATLAR

Küçük Ev Aletlerinde Premium\'a Özel Sepette %5 İndirim Fırsatı

Satın Al

Seçili Vantilatörlerde Premium\'a Özel Sepette Net indirim!

Satın Al

Seçili Televizyonlarda Premiuma Özel Sepette %5 Net İndirim!

Satın Al

Roborock Markalı Süpürgelerde Sepette %8 İndirim!

Satın Al

Arnica GH21480 Diamond Blender Set

Satın Al

Teknoblog'un satış ortaklıkları vardır. Bunlar, editoryal içeriği etkilemez, ancak Teknoblog, satış ortaklığı bağlantıları üzerinden satın alınan ürünler için komisyon kazanabilir.