Ana Sayfa
Manşetler
Google Gemini 3.5 Canlı Çeviri ile konuşmaları anında çevirecek

Manşetler Teknoloji

Google Gemini 3.5 Canlı Çeviri ile konuşmaları anında çevirecek

10 Haziran 2026 08:00

Paylaş:

Google Gemini 3.5 Canlı Çeviri ile konuşmaları anında çevirecek

Google, gerçek zamanlı konuşma çevirisine odaklanan yeni yapay zekâ modeli Gemini 3.5 Canlı Çeviri’yi duyurdu. Şirketin sesli çeviri alanındaki en güncel çözümü olan model, konuşmacının tonlama, tempo ve ses yüksekliği gibi özelliklerini koruyarak 70’ten fazla dil arasında anlık çeviri yapabiliyor. Google’ın açıklamasına göre sistem bugünden itibaren geliştiriciler, kurumsal müşteriler ve son kullanıcılar için farklı ürünlerde kademeli olarak kullanıma açılıyor.

Google’ın çeviri teknolojileri yaklaşık yirmi yıl önce makine öğrenmesi alanındaki ilk deneylerinden biri olarak başlamıştı. Aradan geçen süreçte Google Çeviri ve diğer servisler üzerinden her ay milyarlarca kullanıcı için bir trilyondan fazla kelime çevriliyor. Şirket, Gemini 3.5 Canlı Çeviri ile bu deneyimi yalnızca metin düzeyinde değil, doğal ve kesintisiz sesli iletişim alanında da ileri taşımayı hedefliyor.

Geleneksel konuşma çeviri sistemlerinde kullanıcıların çeviri alınabilmesi için konuşmacının cümlesini tamamlaması gerekiyor. Gemini 3.5 Canlı Çeviri ise konuşma devam ederken çeviriyi üretmeye başlayarak daha akıcı bir iletişim sağlıyor. Model, çeviri doğruluğunu artırmak için bağlamı beklemek ile konuşmacıya senkron kalmak arasında denge kuruyor. Böylece uzun sessizlikler veya doğal olmayan duraksamalar olmadan, konuşmacıyı yalnızca birkaç saniyelik gecikmeyle takip edebiliyor.

Gemini 3.5 Canlı Çeviri üç farklı Google hizmetine geliyor

Google, yeni modeli ilk aşamada geliştiriciler, işletmeler ve bireysel kullanıcılar için farklı platformlarda erişime açıyor. Geliştiriciler Gemini Live API ve Google AI Studio üzerinden herkese açık ön izleme kapsamında sisteme erişebilecek. Kurumsal müşteriler tarafında ise Google Meet entegrasyonu bu ay seçili Google Workspace müşterileri için özel ön izleme sürecine giriyor. Son kullanıcılar ise Android ve iOS işletim sistemlerindeki Google Çeviri uygulaması üzerinden yeni deneyimi kullanabilecek.

Model, konuşmaları aktarım sırasında işleyerek gerçek zamanlı çeviri üretiyor. Bunun yanında farklı dilleri otomatik olarak algılayabildiği için kullanıcıların dil ayarlarını manuel olarak yapılandırması gerekmiyor. Gürültülü ortamlarda çalışma kabiliyeti de geliştirilen sistemin öne çıkan özellikleri arasında yer alıyor. Bu sayede çok dilli toplantılar, çevrim içi dersler, yayınlar veya telefon görüşmeleri gibi farklı kullanım senaryolarında daha tutarlı sonuçlar elde edilmesi amaçlanıyor.

$Grundig 75 GQ 700A 75\" 190 Ekran 4K Ultra HD Google Smart QLED TV$

Grundig 75 GQ 700A 75\" 190 Ekran 4K Ultra HD Google Smart QLED TV

$MSI CYBORG 15 A13UC-2087XTR Intel Core i5 13420H 16GB 512GB SSD RTX3050 Freedos 15.6\" FHD 144Hz Taşınabilir Bilgisayar$

MSI CYBORG 15 A13UC-2087XTR Intel Core i5 13420H 16GB 512GB SSD RTX3050 Freedos 15.6\" FHD 144Hz Taşınabilir Bilgisayar

Samsung Windfree Premium AR60F12C1KW/SK A++ 12000 Btu Inverter Duvar Tipi Klima

Samsung Windfree Premium AR60F12C1KW/SK A++ 12000 Btu Inverter Duvar Tipi Klima

Arçelik 9120 Dmx 1200 Devir 9 kg Çamaşır Makinesi

Arçelik 9120 Dmx 1200 Devir 9 kg Çamaşır Makinesi

Beko 970471 MB Üstten Donduruculu Buzdolabı

Beko 970471 MB Üstten Donduruculu Buzdolabı

Duracell 18W Araç Şarj Aleti Çakmaklık Type-C PD + USB-A – Çift Çıkışlı Hızlı Şarj Cihazı

Duracell 18W Araç Şarj Aleti Çakmaklık Type-C PD + USB-A – Çift Çıkışlı Hızlı Şarj Cihazı

Tümünü Gör Daralt

Tüm Fırsatları Gör

Teknoblog'un satış ortaklıkları vardır. Bunlar, editoryal içeriği etkilemez, ancak Teknoblog, satış ortaklığı bağlantıları üzerinden satın alınan ürünler için komisyon kazanabilir.

İLGİNİZİ ÇEKEBİLİR

Google Gemini 3.6 Flash ile maliyeti ve token tüketimini düşürdü

Google Gemini 3.6 Flash ile maliyeti ve token tüketimini düşürdü

Google’ın yapay zekâ asistanı Gemini 950 milyon kullanıcıya ulaştı

Google’ın yapay zekâ asistanı Gemini 950 milyon kullanıcıya ulaştı

Samsung’un yeni katlanabilir telefonları Gemini Nano 4 ile geliyor

Samsung’un yeni katlanabilir telefonları Gemini Nano 4 ile geliyor

Google Haritalar’ın yeni yapay zekâ özelliği beta sürümünde ortaya çıktı

Google Haritalar’ın yeni yapay zekâ özelliği beta sürümünde ortaya çıktı

Claude Opus 5, Fable 5’e yakın gücü yarı fiyatla sunuyor

Claude Opus 5, Fable 5’e yakın gücü yarı fiyatla sunuyor

Google, sesli çeviri uygulamaları geliştiren şirketlerin de Gemini Live API desteğinden yararlanabileceğini belirtiyor. Agora, Fishjam, LiveKit, Pipecat ve Vision Agents gibi platformlar, gerçek zamanlı medya akışı altyapısını geliştiriciler adına yöneterek sesli çeviri çözümlerinin daha hızlı oluşturulmasına yardımcı oluyor. Böylece geliştiriciler altyapı ayrıntılarından çok kullanıcı deneyimine odaklanabiliyor.

Şirketin iş ortaklarından Grab da yeni modeli test eden kuruluşlar arasında bulunuyor. Grab, sürücüler ile yolcular arasındaki iletişimi farklı diller arasında neredeyse gerçek zamanlı hâle getirmeyi amaçlıyor. Platform üzerinden her ay 10 milyondan fazla sesli görüşme gerçekleştirildiği düşünüldüğünde, bu tür bir entegrasyonun günlük kullanım açısından dikkat çekici bir örnek sunduğu görülüyor.

Google Meet tarafında yapılacak güncelleme de dikkat çekiyor. Daha önce yalnızca beş dili destekleyen konuşma çevirisi sistemi artık 70’in üzerinde dili destekleyecek. Bunun yanında yalnızca İngilizce merkezli çeviri yerine 2.000’den fazla dil kombinasyonu arasında doğrudan çeviri yapılabilecek. Google ayrıca konuşma çevirisine erişimi kolaylaştıran yeni bir arayüz üzerinde çalıştığını da belirtiyor. İlk etapta özel ön izleme kapsamında sunulacak bu yeniliklerin yıl içinde daha geniş kullanıcı kitlesine ulaşması planlanıyor.

Google Çeviri uygulamasında ise kullanıcılar herhangi bir kulaklık bağlayarak Canlı Çeviri özelliğinden yararlanabilecek. Sistem, konuşmacının ses tonunu ve konuşma biçimini mümkün olduğunca koruyarak daha doğal bir dinleme deneyimi sunuyor. Android kullanıcıları için hazırlanan yeni “dinleme modu” da çevirilerin doğrudan telefonun ahizesinden dinlenmesine olanak tanıyor. Böylece kulaklık bulunmayan durumlarda kullanıcılar telefonu normal bir telefon görüşmesindeki gibi kulağına götürerek çeviriyi dinleyebiliyor.

Google, yapay zekâ tarafından üretilen tüm seslerin SynthID teknolojisiyle işaretlendiğini de vurguluyor. İnsan kulağı tarafından fark edilmesi mümkün olmayan bu dijital işaretleme yöntemi, yapay zekâ üretimi içeriklerin tespit edilebilmesini sağlayarak yanlış bilgi ve sahte içeriklerin yayılmasını sınırlandırmaya yardımcı oluyor. Yeni modelin öne çıkan yönleri arasında geniş dil desteği, düşük gecikme süresi ve doğal konuşma akışı bulunurken, gerçek kullanım performansının farklı diller ve senaryolar altında nasıl şekilleneceği ise önümüzdeki dönemde daha net ortaya çıkacak.

Teknoblog artık WhatsApp'taGünün en iyi teknoloji fırsatları ve kaçırmamanız gereken büyük haberler, telefonunuza gelsin.

Yazar:Sinan Küstür

Medya, Kültür ve Kimlik üzerine yüksek lisans yaptı. Teknolojiye olan ilgisini ve eğitiminin sunduğu donanımı Teknoblog çatısı altında sunuyor.