Google, üretken yapay zekâ tarafında yeni bir modeli geliştiricilerle buluşturdu. Şirket, Gemini 3.1 Flash-Lite adını verdiği modeli salı günü itibarıyla Google AI Studio ve Vertex AI üzerinden erişime açtı. İlk aşamada ön izleme sürümü olarak yayımlanan model, özellikle yoğun API kullanımına sahip projeler için tasarlandı.
Google, bu modeli geliştirirken iki temel noktaya odaklandı: hız ve maliyet. Yeni model, yüksek hacimli üretim görevlerinde hızlı yanıt üretirken işlem maliyetini mümkün olduğunca düşük tutmayı hedefliyor. Bu nedenle şirket, Gemini ailesindeki en hızlı ve en ekonomik seçenek olarak Gemini 3.1 Flash-Lite modelini konumlandırıyor.
Resmi teknik bilgiler incelendiğinde performans tarafında belirgin bir sıçrama görülüyor. Google’ın paylaştığı verilere göre model, Gemini 2.5 Flash ile karşılaştırıldığında çıktı üretim hızını yaklaşık %45 artırıyor. Bu artış özellikle yüksek sayıda isteğin işlendiği uygulamalarda fark edilir bir hız kazancı oluşturuyor.
Performans ölçümleri yalnızca hızla sınırlı kalmıyor. Model, Arena.ai liderlik tablosunda 1.432 Elo puanına ulaşıyor. Bu skor, modelin akıl yürütme ve çok modlu anlama testlerinde güçlü sonuçlar verdiğini gösteren önemli teknik göstergeler arasında yer alıyor.
Google yeni Gemini modelini geliştiricilere açtı
Gemini 3.1 Flash-Lite modeli, Gemini API üzerinden geliştiricilerin erişimine sunuluyor. Bunun yanında kurumsal kullanıcılar da modeli Vertex AI platformu üzerinden test edebiliyor. Bu iki kanal sayesinde model hem bireysel geliştiriciler hem de şirketler tarafından kullanılabiliyor.
Bunun yanında Google, modelde dinamik düşünme seviyeleri bulunduğunu açıklıyor. Geliştiriciler görevlerin karmaşıklığına göre modelin akıl yürütme yoğunluğunu ayarlayabiliyor. Böylece daha hızlı yanıt üretmek veya daha derin analiz yapmak arasında tercih yapılabiliyor.
Modelin performans testleri farklı alanlarda ölçüldü. GPQA Diamond benchmark testinde model %86,9 başarı oranına ulaştı. Çok modlu değerlendirme testlerinden biri olan MMMU Pro benchmark’ında ise %76,8 sonuç elde edildi.
Bu teknik veriler, modelin yalnızca metin üretimi değil, aynı zamanda çok modlu görevlerde de kullanılabildiğini gösteriyor. Bunun yanında sistem; içerik moderasyonu, yüksek hacimli çeviri işlemleri, veri çıkarımı ve otomasyon görevleri gibi yoğun işlem gerektiren senaryolara yönelik geliştirildi.
Google, yeni modeli özellikle büyük ölçekli uygulamalar için hazırladı. Geliştiriciler çok sayıda isteği aynı anda işleyen servislerde daha hızlı yanıt üretme imkânı elde ediyor. Bunun yanında düşük maliyet hedefi, yüksek hacimli yapay zekâ kullanımını daha erişilebilir hâle getiriyor.








