ManşetlerTeknoloji

Google Gemini 3.5 Canlı Çeviri ile konuşmaları anında çevirecek

Google Gemini 3.5 Canlı Çeviri ile konuşmaları anında çevirecek
Haberleri Kaçırma! Teknoblog'u Google Arama'da tercihli kaynağın yap ve En Çok Okunan Haberler'de bizi daha sık gör.
Tercihli Kaynak Ekle

Google, gerçek zamanlı konuşma çevirisine odaklanan yeni yapay zekâ modeli Gemini 3.5 Canlı Çeviri’yi duyurdu. Şirketin sesli çeviri alanındaki en güncel çözümü olan model, konuşmacının tonlama, tempo ve ses yüksekliği gibi özelliklerini koruyarak 70’ten fazla dil arasında anlık çeviri yapabiliyor. Google’ın açıklamasına göre sistem bugünden itibaren geliştiriciler, kurumsal müşteriler ve son kullanıcılar için farklı ürünlerde kademeli olarak kullanıma açılıyor.

Google’ın çeviri teknolojileri yaklaşık yirmi yıl önce makine öğrenmesi alanındaki ilk deneylerinden biri olarak başlamıştı. Aradan geçen süreçte Google Çeviri ve diğer servisler üzerinden her ay milyarlarca kullanıcı için bir trilyondan fazla kelime çevriliyor. Şirket, Gemini 3.5 Canlı Çeviri ile bu deneyimi yalnızca metin düzeyinde değil, doğal ve kesintisiz sesli iletişim alanında da ileri taşımayı hedefliyor.

Geleneksel konuşma çeviri sistemlerinde kullanıcıların çeviri alınabilmesi için konuşmacının cümlesini tamamlaması gerekiyor. Gemini 3.5 Canlı Çeviri ise konuşma devam ederken çeviriyi üretmeye başlayarak daha akıcı bir iletişim sağlıyor. Model, çeviri doğruluğunu artırmak için bağlamı beklemek ile konuşmacıya senkron kalmak arasında denge kuruyor. Böylece uzun sessizlikler veya doğal olmayan duraksamalar olmadan, konuşmacıyı yalnızca birkaç saniyelik gecikmeyle takip edebiliyor.

Gemini 3.5 Canlı Çeviri üç farklı Google hizmetine geliyor

Google, yeni modeli ilk aşamada geliştiriciler, işletmeler ve bireysel kullanıcılar için farklı platformlarda erişime açıyor. Geliştiriciler Gemini Live API ve Google AI Studio üzerinden herkese açık ön izleme kapsamında sisteme erişebilecek. Kurumsal müşteriler tarafında ise Google Meet entegrasyonu bu ay seçili Google Workspace müşterileri için özel ön izleme sürecine giriyor. Son kullanıcılar ise Android ve iOS işletim sistemlerindeki Google Çeviri uygulaması üzerinden yeni deneyimi kullanabilecek.

Model, konuşmaları aktarım sırasında işleyerek gerçek zamanlı çeviri üretiyor. Bunun yanında farklı dilleri otomatik olarak algılayabildiği için kullanıcıların dil ayarlarını manuel olarak yapılandırması gerekmiyor. Gürültülü ortamlarda çalışma kabiliyeti de geliştirilen sistemin öne çıkan özellikleri arasında yer alıyor. Bu sayede çok dilli toplantılar, çevrim içi dersler, yayınlar veya telefon görüşmeleri gibi farklı kullanım senaryolarında daha tutarlı sonuçlar elde edilmesi amaçlanıyor.

Google, sesli çeviri uygulamaları geliştiren şirketlerin de Gemini Live API desteğinden yararlanabileceğini belirtiyor. Agora, Fishjam, LiveKit, Pipecat ve Vision Agents gibi platformlar, gerçek zamanlı medya akışı altyapısını geliştiriciler adına yöneterek sesli çeviri çözümlerinin daha hızlı oluşturulmasına yardımcı oluyor. Böylece geliştiriciler altyapı ayrıntılarından çok kullanıcı deneyimine odaklanabiliyor.

Şirketin iş ortaklarından Grab da yeni modeli test eden kuruluşlar arasında bulunuyor. Grab, sürücüler ile yolcular arasındaki iletişimi farklı diller arasında neredeyse gerçek zamanlı hâle getirmeyi amaçlıyor. Platform üzerinden her ay 10 milyondan fazla sesli görüşme gerçekleştirildiği düşünüldüğünde, bu tür bir entegrasyonun günlük kullanım açısından dikkat çekici bir örnek sunduğu görülüyor.

Google Meet tarafında yapılacak güncelleme de dikkat çekiyor. Daha önce yalnızca beş dili destekleyen konuşma çevirisi sistemi artık 70’in üzerinde dili destekleyecek. Bunun yanında yalnızca İngilizce merkezli çeviri yerine 2.000’den fazla dil kombinasyonu arasında doğrudan çeviri yapılabilecek. Google ayrıca konuşma çevirisine erişimi kolaylaştıran yeni bir arayüz üzerinde çalıştığını da belirtiyor. İlk etapta özel ön izleme kapsamında sunulacak bu yeniliklerin yıl içinde daha geniş kullanıcı kitlesine ulaşması planlanıyor.

Google Çeviri uygulamasında ise kullanıcılar herhangi bir kulaklık bağlayarak Canlı Çeviri özelliğinden yararlanabilecek. Sistem, konuşmacının ses tonunu ve konuşma biçimini mümkün olduğunca koruyarak daha doğal bir dinleme deneyimi sunuyor. Android kullanıcıları için hazırlanan yeni “dinleme modu” da çevirilerin doğrudan telefonun ahizesinden dinlenmesine olanak tanıyor. Böylece kulaklık bulunmayan durumlarda kullanıcılar telefonu normal bir telefon görüşmesindeki gibi kulağına götürerek çeviriyi dinleyebiliyor.

Google, yapay zekâ tarafından üretilen tüm seslerin SynthID teknolojisiyle işaretlendiğini de vurguluyor. İnsan kulağı tarafından fark edilmesi mümkün olmayan bu dijital işaretleme yöntemi, yapay zekâ üretimi içeriklerin tespit edilebilmesini sağlayarak yanlış bilgi ve sahte içeriklerin yayılmasını sınırlandırmaya yardımcı oluyor. Yeni modelin öne çıkan yönleri arasında geniş dil desteği, düşük gecikme süresi ve doğal konuşma akışı bulunurken, gerçek kullanım performansının farklı diller ve senaryolar altında nasıl şekilleneceği ise önümüzdeki dönemde daha net ortaya çıkacak.

Bu fırsatlar ilginizi çekebilir

Samsung Galaxy S25 Ultra 512 GB - %0 Faizli 3 Taksit Fırsatı
Xiaomi 17T Serisi Lansmana Özel Fırsatlarla Burada!
Lenovo Idea Tab Plus 8gb 256GB 12.1\" 2.5k 600NITS Tablet+Kalem+Kılıf ZAG70130TR
HONOR Pad X9A 8gb 256GB Wi-Fi 11.5 Inç IPS Uzay Gri Tablet -Uzay Grisi
Huawei Yeni (2025) Matepad 12X 12.0\" Papermatte Edition 12GB 256GB Yeşil + Klavye
Xiaomi Smart Band 10 Ceramic Edition Pearl White Akıllı Bileklik

Teknoblog'un satış ortaklıkları vardır. Bunlar, editoryal içeriği etkilemez, ancak Teknoblog, satış ortaklığı bağlantıları üzerinden satın alınan ürünler için komisyon kazanabilir.