Google Gemini, Lyrica 3 ile metinden müzik üretiyor

Google, üretken yapay zekâ alanındaki genişlemesini bu kez müzik üretimi tarafına taşıdı. Gemini, artık yalnızca metin ve görsel oluşturmuyor; yazılan komutları ve yüklenen fotoğrafları doğrudan şarkıya dönüştürüyor. Bu adımın merkezinde ise Google DeepMind imzası taşıyan Lyria 3 yer alıyor.

Google DeepMind, bugüne kadarki en gelişmiş müzik modeli olarak konumlandırdığı Lyria 3’ü küresel ölçekte erişime açtı. Böylece Gemini uygulaması, masaüstünde müzik üretim özelliğini aktif hâle getirdi. Mobil uygulama desteğinin ise önümüzdeki günlerde gelmesi planlanıyor. Kullanıcılar gemini.google.com üzerinden özelliği doğrudan deneyebiliyor.

Model, metin ve görsel girdileri birlikte işleyebilen çok modlu bir sistemle çalışıyor. Bu sayede yalnızca yazılan bir komut değil, yüklenen bir fotoğraf da müzik üretiminin parçası hâline geliyor. Örneğin bir orman yürüyüşü fotoğrafı yüklendiğinde sistem sahnenin atmosferini analiz ediyor ve buna uygun bir beste oluşturuyor.

Bununla birlikte Lyria 3, sıradan bir metni saniyeler içinde sözlü ve besteli bir parçaya dönüştürüyor. Bir alışveriş listesi, kısa bir mesaj ya da gündelik bir diyalog doğrudan rap formatında üretilebiliyor. “Cips, soda, çikolata, ekmek ve yoğurt” gibi basit bir liste, ritimli bir şarkı sözüne dönüşüyor.

Gemini, Lyria 3 ile metin ve görselden şarkı üretir

Lyria 3 üç temel özellikle öne çıkıyor. İlk olarak Otomatik Şarkı Sözü sistemi devreye giriyor ve verilen komuta uygun sözleri doğrudan oluşturuyor. Böylece kullanıcı ayrıca söz yazmak zorunda kalmıyor.

İkinci olarak model, BPM (tempo), müzik tarzı ve vokal detayları üzerinde kontrol sunuyor. Kullanıcı tempo değerini belirliyor, türü seçiyor ve vokal karakterini tarif ediyor. Ardından model bu parametrelere uygun bir kompozisyon üretiyor.

Üçüncü olarak sistem, görsel destekli üretimi aktif biçimde kullanıyor. Gemini, yüklenen fotoğrafın renk tonlarını, ortamını ve bağlamını analiz ediyor. Daha sonra bu analiz doğrultusunda müzikal atmosferi belirliyor. Böylece görsel ile ses arasında doğrudan bir ilişki kuruluyor.

Üretilen her 30 saniyelik parça için özel bir kapak görseli hazırlanıyor. Nano Banana altyapısı, bu kapak tasarımlarını otomatik oluşturuyor. Kullanıcılar parçayı ve görseli indiriyor ya da bağlantı üzerinden paylaşıyor.

Google, içerik doğrulama tarafını da sistemin içine entegre ediyor. Üretilen tüm ses dosyaları SynthID dijital filigranı ile işaretleniyor. İnsan kulağı bu damgayı algılamıyor; ancak sistem, dosyanın yapay zekâ üretimi olduğunu teknik olarak doğruluyor.

Bununla da sınırlı kalmıyor. Gemini, dışarıdan yüklenen bir ses dosyasını analiz ediyor ve Google AI tarafından üretilip üretilmediğini kontrol ediyor. Model, hem SynthID imzasını tarıyor hem de kendi analiz mekanizmasını devreye alıyor.

Lyria 3; İngilizce, Almanca, İspanyolca, Fransızca, Hintçe, Japonca, Korece ve Portekizce olmak üzere sekiz dilde sunuluyor. Özellik, 18 yaş ve üzeri kullanıcılara açık şekilde çalışıyor. Google AI Plus, Pro ve Ultra aboneleri daha yüksek kullanım limitlerine erişiyor.

Google, dil kapsamını ve üretim kalitesini genişletmeyi planlıyor. Böylece yapay zekâ müzik üretimi, metin ve görsel üretiminin yanında üçüncü bir içerik katmanı olarak Gemini içinde yerini alıyor.

Teknoblog, teknoloji gündemini farklı platformlarda düzenli biçimde paylaşıyor. WhatsApp kanalında öne çıkan haberleri anlık olarak aktarıyor, Google Haberler üzerinden güncel içerikleri sunuyor, Instagram ve X hesaplarında dikkat çeken başlıkları özetliyor, YouTube kanalında ise ürün incelemeleri ve detaylı anlatımlarla içeriği tamamlıyor.

Lyria 3, Gemini içinde müzik üretimini başlatıyor

Gemini, Lyria 3 ile metin ve görselden şarkı üretir

Pixel 10a 3.000 nit parlaklık ve 7 yıl güncelleme ile geliyor

Android’de yeni dönem: Gemini bölünmüş ekranda aktif destek sunuyor

Apple’dan iPhone’u “gören ve duyan” yapay zekâ kolyesi geliyor

ChatGPT’ye yeni güvenlik kalkanı: Kilitlenme modu ne sunuyor?

Google’dan Android’e kritik güncelleme: İndirilen dosyalar artık güvende

AI Bakışı, Google Arama sonuçlarını değiştiriyor

Lyria 3, Gemini içinde müzik üretimini başlatıyor

Pixel 10a 3.000 nit parlaklık ve 7 yıl güncelleme ile geliyor

Apple’dan iPhone’u “gören ve duyan” yapay zekâ kolyesi geliyor

ChatGPT’ye yeni güvenlik kalkanı: Kilitlenme modu ne sunuyor?

AI Bakışı, Google Arama sonuçlarını değiştiriyor

FIRSATLAR

Ryzen 7’li Lenovo Ideapad Slim 3 MediaMarkt kampanyasında indirimde

M5 işlemcili iPad Pro 1TB MediaMarkt’ta indirime girdi

iPhone 17 256 GB modelinde fiyat avantajı başladı (Şubat 2026)

MediaMarkt bazı Galaxy Watch modellerinde sepette indirimi açtı

5.000 TL’ye varan indirim kampanyası Apple Watch modellerine geldi

İNCELEMELER

Katlanabilir, ama ödün vermeyen bir amiral gemisi mi? Huawei Mate X7 İncelemesi

200 megapiksel kamera kompakt gövdeyle buluştu: Oppo Reno 15 Pro İncelemesi

Her günün en iyi kamerası cebinizde: iPhone 17 Pro İncelemesi

144 Hz PaperMatte ekranıyla akıcılığın zirvesinde: Huawei MatePad 11.5 S İncelemesi

Lensin gücü, pilin ömrü: Oppo Find X9 Pro İncelemesi

Gemini, Lyria 3 ile metin ve görselden şarkı üretir

İLGİLİ HABERLER