OpenAI, bu yılın en iddialı yapay zekâ güncellemelerinden birini daha duyurdu. Şirketin yeni modeli O3-Pro, daha önce tanıtılan O3 yapay zekâ motorunun gelişmiş ve kapsamı genişletilmiş bir versiyonu olarak öne çıkıyor. OpenAI O3-Pro, özellikle problem çözme ve mantıksal akıl yürütme süreçlerinde daha tutarlı ve sağlam sonuçlar sunmasıyla dikkat çekiyor.
Modelin temel farkı, klasik yapay zekâ sistemlerinden ayrılarak adım adım düşünme becerisine sahip olması. Bu özellik, modeli özellikle matematik, fizik, yazılım ve teknik analiz gibi alanlarda daha güvenilir hâle getiriyor. O3-Pro, kullanıcıların karmaşık sorunlara daha yapılandırılmış çözümler üretmesini kolaylaştırıyor.
OpenAI, O3-Pro ile daha doğru ve açık cevaplar vadediyor
Yeni model, 11 Haziran itibarıyla ChatGPT Pro ve Team kullanıcıları için aktif hale getirildi. OpenAI, kurumsal (Enterprise) ve eğitim (Edu) kullanıcılarının da modeli bir hafta içinde kullanmaya başlayacağını belirtti. Öte yandan geliştiriciler için O3-Pro, aynı gün içinde OpenAI API üzerinden de erişime açıldı.
O3-Pro’nun API kullanım maliyetleri de açıklandı. 1 milyon giriş (input) token’ı için 20 dolar, 1 milyon çıkış (output) token’ı için ise 80 dolar talep ediliyor. Giriş token’ı kullanıcı tarafından modele sunulan veriyi, çıkış token’ı ise modelin ürettiği yanıtı temsil ediyor. Yaklaşık 750.000 kelimeye denk gelen bu veri hacmi, roman uzunluğunda içeriklerle çalışmayı mümkün kılıyor.
OpenAI, modelin kapsamlı iç test sonuçlarını da kullanıcılarla paylaştı. Uzmanlar, O3-Pro’nun selefi O3’e kıyasla her test kategorisinde daha başarılı sonuçlar verdiğini ifade ediyor. Bu değerlendirmelerde özellikle bilim, yazılım, eğitim, iş yazışmaları ve metin düzenleme gibi alanlarda öne çıktığı vurgulanıyor. Tüm bunların yanında modelin netlik, detaylılık, yönergelere uyum ve doğruluk gibi kriterlerde daha üst düzey performans sergilediği aktarılıyor.
O3-Pro’nun teknik yetenekleri arasında dosya analizi, Python kullanımı, internet taraması ve görsel içerikler üzerinde mantık yürütme gibi gelişmiş özellikler bulunuyor. Model, aynı zamanda kullanıcının geçmiş tercihlerine dayalı kişiselleştirilmiş yanıtlar da sunabiliyor. Buna rağmen O3-Pro’nun yanıt üretim süresinin, bir önceki model olan O1-Pro’ya göre bir miktar daha yavaş olduğu belirtiliyor.
Bunun yanı sıra O3-Pro’nun bazı sınırlamaları da kullanıcı deneyimini etkileyebiliyor. ChatGPT platformundaki geçici sohbet özelliği, geçici bir teknik sorun nedeniyle şu anda devre dışı bırakılmış durumda. O3-Pro aynı zamanda görsel üretim özelliğine sahip değil ve OpenAI’nin Canvas adlı AI destekli çalışma alanı da bu modelle şimdilik uyumlu değil.
Ne var ki modelin çeşitli yapay zekâ testlerinde elde ettiği başarılar, mevcut sınırlamaları ikinci plana atıyor. OpenAI’ye göre O3-Pro, matematiksel yetkinliği ölçen AIME 2024 testinde Google’ın önde gelen modeli Gemini 2.5 Pro’yu geride bıraktı. Bununla birlikte doktora seviyesindeki bilim bilgisini değerlendiren GPQA Diamond testinde de Anthropic’in Claude 4 Opus modelinden daha iyi performans gösterdi.
Bu başarılar, modelin yalnızca günlük konuşmalar ya da temel metin üretimleri için değil, aynı zamanda profesyonel ve akademik kullanım senaryoları için de uygun olduğunu ortaya koyuyor. O3-Pro, kapsamlı veri setleriyle çalışabilme kapasitesi ve adım adım analiz yapabilme yeteneği sayesinde, araştırma temelli işler için de güçlü bir araç olarak konumlanıyor.