Meta, yapay zekâ ses teknolojileri geliştiren WaveForms AI girişimini satın aldı. Sekiz ay önce kurulan şirket, insan sesi ile AI üretimi ses arasındaki farkı ayırt etmenin zorlaştığı projeler üzerinde çalışıyordu.
WaveForms AI, Andreessen Horowitz liderliğinde gerçekleştirilen yatırım turunda 40 milyon dolar toplamış ve bu süreçte 160 milyon dolar değerlemeye ulaşmıştı. Şirketin üç kurucusundan Alexis Conneau ve Coralie Lemaitre, satın alım sonrasında Meta’ya geçti. Conneau, OpenAI’da görev yaptığı dönemde GPT-4o Advanced Voice Mode üzerinde geliştirmeler yapmıştı. Lemaitre ise Google’da reklam stratejileri alanında çalışmıştı.
WaveForms’un odaklandığı projeler arasında, “Speech Turing Test” ve “Emotional General Intelligence” yer alıyor. İlk kavram, dinleyicilerin AI ve insan sesi arasındaki farkı ayırt edip edemediğini ölçerken, ikinci kavram sesin yalnızca doğru kelimeleri değil, aynı zamanda duygusal tonu da yansıtabilmesini hedefliyor. Şirket, bu sayede hem etkileşimli asistanlarda hem de sanal ortam uygulamalarında daha gerçekçi ses deneyimleri sağlamayı amaçlıyordu.
Meta, sesli yapay zekâ alanındaki yatırımlarını hızlandırıyor
Meta’nın bu satın alımı, Superintelligence Labs adını taşıyan yeni yapay zekâ birimi üzerinden yürütülüyor. Şirket, geçtiğimiz ay da yine AI ses alanında çalışan PlayAI’ı satın almıştı. Her iki girişimin de Johan Schalkwyk yönetiminde aynı ekip çatısı altında faaliyet göstereceği belirtiliyor. Schalkwyk, daha önce Google’da konuşma tanıma teknolojilerinin geliştirilmesinde görev almış deneyimli bir isim olarak biliniyor.
WaveForms AI, satın alımın ardından kendi web sitesini kapattı ancak LinkedIn sayfasında şirketin temel vizyonu hâlâ görülebiliyor. Burada, AI ses teknolojilerinin yalnızca teknik olarak değil, aynı zamanda duygu ve bağlama dayalı olarak da gelişmesi gerektiği vurgulanıyor. Bu yaklaşımın, Meta’nın artırılmış gerçeklik ve sanal gerçeklik platformlarındaki kullanıcı deneyimini geliştirme hedefiyle örtüştüğü ifade ediliyor.
Her ne olursa olsun, bu tür doğal ve duygusal AI seslerinin geliştirilmesi bazı etik sorunları da gündeme getirebilir. Özellikle deepfake ses kayıtları ve kimlik sahteciliği riskleri konusunda önlemler alınması gerektiği uzmanlarca dile getiriliyor. Meta’nın, bu teknolojiyi geliştirirken aynı zamanda güvenlik ve doğrulama mekanizmalarını da güçlendireceği öngörülüyor.