Teknoloji

Apple yapay zekânın birden fazla ihtimali aynı anda test etmesini sağladı

apple dram

Apple araştırmacıları, büyük dil modellerinin yanıt kalitesini artırmayı hedefleyen yeni bir yöntem geliştirdi. LaDiR adı verilen bu yaklaşım, modelin bir soruya yanıt vermeden önce birden fazla olası çözüm yolunu aynı anda değerlendirmesine olanak tanıyor. Kaliforniya Üniversitesi San Diego kampüsünden araştırmacıların da katkı verdiği çalışma, özellikle matematiksel akıl yürütme, kod üretimi ve planlama gibi alanlarda daha isabetli sonuçlar elde edilmesini sağlıyor.

Geleneksel büyük dil modelleri genellikle “otokorelasyon” adı verilen yöntemle çalışıyor ve yanıtları kelime kelime oluşturuyor. Buna karşılık difüzyon modelleri, metni tek tek değil, aynı anda birçok olasılığı değerlendirerek aşamalı biçimde oluşturuyor. Apple’ın önerdiği LaDiR çerçevesi ise bu iki yaklaşımı bir araya getiriyor. Akıl yürütme sürecinde difüzyon mantığı kullanılırken, nihai yanıt yine klasik yöntemle, adım adım oluşturuluyor.

Bu yaklaşımın dikkat çeken yönlerinden biri, birden fazla akıl yürütme yolunun paralel biçimde işletilmesi. Her bir yol, başlangıçta rastgele bir yapıdan yola çıkarak zamanla daha anlamlı bir çözüm haline geliyor. Model, bu süreçte farklı olasılıkları keşfetmeye teşvik ediliyor; böylece tüm yolların erken aşamada aynı sonuca yönelmesi engelleniyor. Bu çeşitlilik, özellikle karmaşık problemlerde daha doğru ve güvenilir yanıtlar üretilmesini mümkün kılıyor.

LaDiR yaklaşımı farklı görevlerde nasıl performans gösteriyor?

Araştırma kapsamında LaDiR yöntemi, Meta’nın LLaMA 3.1 8B modeli üzerinde matematik ve bulmaca çözme görevlerinde test edildi. Bunun yanında Qwen3-8B-Base modeliyle kod üretimi senaryoları da değerlendirildi. Elde edilen sonuçlar, yöntemin mevcut tekniklere kıyasla daha yüksek doğruluk sunduğunu gösteriyor. Özellikle alışılmış veri dağılımının dışındaki zor problemler söz konusu olduğunda performans farkı daha belirgin hale geliyor.

Kod üretimi tarafında, HumanEval gibi kıyaslama testlerinde LaDiR’ın daha tutarlı ve güvenilir çıktılar ürettiği görülüyor. Standart ince ayar yöntemlerine göre daha iyi sonuçlar elde edilirken, farkın zor problemlerde daha da açıldığı belirtiliyor. Öte yandan bulmaca tabanlı planlama görevlerinde, örneğin Countdown oyununda, modelin daha geniş bir çözüm yelpazesi oluşturabildiği ve doğru sonuca ulaşma ihtimalinin arttığı ifade ediliyor. Buna rağmen, tek denemelik başarı oranında belirli bir göreve özel optimize edilmiş modellerin gerisinde kaldığı da not ediliyor.

LaDiR, tamamen yeni bir model olarak konumlandırılmıyor; mevcut büyük dil modellerinin üzerine eklenen bir çerçeve olarak çalışıyor. Bu yönüyle altyapıyı değiştirmek yerine, modelin problem çözme sürecini yeniden şekillendiriyor. Bunun yanında yöntem, hesaplama maliyeti ve karmaşıklık açısından bazı ek yükler getirebiliyor; çünkü aynı anda birden fazla akıl yürütme süreci yürütülüyor.

Tüm bunlara ek olarak, çalışma büyük dil modellerinin nasıl düşündüğünü iyileştirmeye yönelik alternatif yaklaşımların giderek çeşitlendiğini gösteriyor. LaDiR’ın sunduğu paralel akıl yürütme fikri, özellikle daha güvenilir ve açıklanabilir yapay zekâ sistemleri geliştirme çabalarında dikkat çeken bir örnek olarak öne çıkıyor. Buna rağmen, yöntemin gerçek dünya uygulamalarında ne ölçüde yaygınlaşacağı, performans kazanımlarının maliyetle dengelenip dengelenemeyeceğine bağlı görünüyor.

📡 Teknoblog'u takip et Teknoloji gündemini kaçırmamak için 📰 Google Haberler'e ekle, 💬 WhatsApp kanalımıza katıl, ▶ YouTube'a abone ol, 📷 Instagram'da ve 𝕏 X'te bizi takip et.