Teknoloji

Google Duo görüşmelerinin kalitesini yapay zekâ ile artırıyor

Google Duo'daki grup görüşmelerinde katılımcı sınırı yükseldi

Google, Duo ile yapılan görüşmelerde, servisin düzgün bir bağlantı sürdürememesi durumunda ses kalitesini iyileştirecek yeni bir teknoloji çıkardı. Bu teknoloji WaveNetEQ adını taşıyor.

Google’ın DeepMind birimi tarafından geliştirilen bir teknolojiyi temel alan WaveNetEQ,  seste meydana gelen titreşimleri, yapay öğrenme kullanılarak üretilen ve insan sesine benzeyen yapay gürültüyle değiştiriyor.

Eğer internet üzerinden bir görüşme yaptıysanız, ses titreşimini mutlaka yaşamışsınızdır. Bu durum görüşme sırasında gönderilen ses veri paketlerinin karşı tarafa ulaşırken kaybolması ya da karşı tarafa geç ulaşması veya yanlış sırada ulaşması sonucu oluşur. Google, Duo görüşmelerinin yüzde 99’unda paket kaybının oluştuğunu söylüyor. Bu kaybın yüzde 20’sinde sesin yüzde 3’ü aşkın kısmı kayboluyor. Yüzde 10’luk diliminde ise kayıp yüzde 8’in üzerinde oluyor. Bu da, değiştirilmesi gereken epey fazla miktarda ses bilgisinin olduğunu gösteriyor.

Aslında her görüşme uygulamasının bir şekilde paket kaybıyla uğraşması gerekiyor. Ancak Google bu paket kaybını gizleme (PLC) süreçlerinde, robotik veya tekrarlayan sesi çıkarmadan, 60ms veya daha fazla süredeki boşluğun doldurulabileceğini söylüyor. WaveNetEQ’nun çözümü DeepMind’ın nöral ağ teknolojisine dayanıyor. 48 farklı dilden 100’ün üzerinde konuşmacıdan alınan verilerle yapay zekâ eğitiliyor.

Google Duo ile WaveNetEQ kullanım örnekleri

Aşağıdaki birkaç ses örneğinde Google, WaveNetEQ’yu genel olarak kullanılan bir PLC teknolojisi olan NetEQ ile karşılaştırıyor. 60 milisaniyelik paket kaybının giderilmesi sırasında sesler aşağıdaki gibi çıkıyor:




120 milisaniyelik paket kaybında ise aradaki fark aşağıdaki gibi oluyor:



Ne var ki, sistemin değiştirebileceği sesin miktarı sınırlı. Google’ın teknolojisi kelimelerin tümü yerine kısa sesleri değiştirecek biçimde tasarlanmış. Yani 120 milisaniyenin sonrasında ses azalıyor ve sessizlik üretmeye başlıyor. Google, sistemi dikkat çekecek biçimde yeni bir ses üretmeyecek şekilde tasarladığını söylüyor. Aynı zamanda, tüm işleme süreci cihaz üzerinde gerçekleşiyor, çünkü Google Duo görüşmeleri uçtan uca şifreli biçimde ayarlanmış durumda. Aramanın gerçek sesi devam ettiğinde, WaveNetEQ kesintisiz bir şekilde arka plana çekiliyor.

Bu düzgün teknoloji parçası sayesinde internet bağlantısının kötüleştiği durumlarda bile karşı tarafın ne söylediğini daha iyi anlayabilirsiniz. Bu teknoloji Pixel 4 üzerinde gerçekleştirilen Duo görüşmelerinde zaten kullanılıyordu. Google, adlarını açıklamasa da, gelecekte diğer cihazlara getirmek için çalışmakta olduğunu kaydetti.

Teknoblog’u XFlipboard, Google Haberler ve Instagram‘da takip et!

İLGİLİ HABERLER