ManşetlerTeknoloji

Google Gemini’a fotoğraftan videoya dönüştürme özelliği geldi

google gemini

Google, yapay zekâ destekli Gemini platformuna fotoğraf tabanlı video üretim özelliği ekledi. Bu özellik sayesinde kullanıcılar, yükledikleri tek bir görüntüden sekiz saniyelik bir video elde edebiliyor. Üretilen videolarda, ortama uygun arka plan sesleri, konuşmalar ve efektler de yer alıyor. Özellik şu an için yalnızca Google AI Ultra ve Pro abonelerine açık durumda.

Kullanıcılar, Gemini arayüzü içindeki “araçlar” menüsünden “video” seçeneğine tıklayarak fotoğraflarını yükleyebiliyor. Video üretimi için yalnızca görsel değil, hareketi tanımlayan kısa bir metin de gerekiyor. Ek olarak, sahnede hangi seslerin yer alması isteniyorsa, bunlar da açıklanabiliyor. Google, bu seslerin videoyla tam senkron içinde olacağını belirtiyor. Hazırlanan videolar 720p çözünürlükte, MP4 formatında ve 16:9 oranında sunuluyor.

Google, bu yeni aracı Gemini Pro ve Ultra aboneleri için seçili bölgelerde kullanıma açtı. Web üzerinden erişim hemen sağlanırken, mobil cihazlar için dağıtımın hafta boyunca devam edeceği bildirildi. Avrupa’da Gemini Pro aboneleri, “Veo 3 Fast” modeli üzerinden sınırlı bir erişime sahip. Bu kullanıcılar, günde en fazla üç kez video üretimi yapabiliyor; bu limit aşıldığında sistem otomatik olarak eski Veo 2 modeline geçiyor.

Google’ın Flow uygulaması 75 ülkede daha kullanılabilir hale getirildi

Google, mart ayında tanıttığı Flow isimli video oluşturma aracını da 75 yeni ülkeye açtı. Bu uygulama, sahne kurma ve kamera hareketi gibi gelişmiş kontrol seçenekleri sunuyor. Flow, Gemini’ye göre daha fazla özelleştirme imkânı sağlıyor fakat ayrı bir uygulama olarak çalışıyor. Yeni özellik ile birlikte, artık Gemini kullanıcıları ek bir uygulama açmadan yalnızca bir fotoğraf üzerinden video üretebiliyor. Böylelikle daha hızlı ve erişilebilir bir deneyim sunulmuş oluyor.

Google’ın geliştirdiği Veo 3 modeli, önceki versiyonlara göre önemli iyileştirmeler içeriyor. Hareket doğruluğu, dudak senkronizasyonu ve ses-görüntü uyumu bu iyileştirmelerin başında geliyor. Ayrıca her videoya hem görünür bir filigran hem de SynthID adında görünmez bir işaretleme ekleniyor. Bu uygulama, içeriğin yapay zekâ tarafından üretildiğini açık biçimde belirtme amacı taşıyor. Google, bu süreçte geniş kapsamlı testler yürüttüğünü ve sistemi yanlış kullanıma karşı hazırladığını belirtiyor.

Kullanıcılar bu özellikle birlikte çizimlerini canlandırabiliyor, doğa fotoğraflarına hareket katabiliyor veya nesneleri gerçekçi biçimde animasyonlaştırabiliyor. İstenen sesler manuel olarak tanımlanabildiği gibi, sistem ortamı otomatik olarak analiz edip önerilerde de bulunabiliyor. Üretilen içerikler sosyal medyada paylaşılabilecek şekilde, kısa ve dikey video akışlarına uygun formatlarda indirilebiliyor. Bu yönüyle hem bireysel içerik üreticilerine hem de görsel hikâye anlatımına odaklanan profesyonellere yeni araçlar sunuluyor.

Veo 3 modeli ilk olarak Google’ın I/O 2025 etkinliğinde duyurulmuştu. Bu modelin Gemini ve Flow ile entegrasyonu, üretim sürecini sadeleştirmek amacıyla yapılmıştı. Her ne kadar şu anda sadece sınırlı bölgelerde erişilebilir olsa da, Google’ın bu özelliği yıl sonuna kadar daha geniş bir kitleye sunmayı planladığı belirtiliyor. Şirketin resmi açıklamasına göre, yeni dil destekleri ve bölgesel dağıtımlar üzerinde çalışmalar sürüyor. Geliştirmeler tamamlandığında, daha fazla kullanıcıya açık hale getirilmesi hedefleniyor.