Teknoloji

Midjourney, görüntü tabanlı yapay zekâ video oluşturucusunu kullanıma sundu

midjourney

Görsel üretim alanındaki başarısıyla bilinen Midjourney, bu kez sahneye video üretim aracıyla çıktı. Yapay zekâ destekli bu yeni sistem, kullanıcılara yalnızca bir görselden başlayarak birkaç saniyelik animasyonlu videolar üretme olanağı sunuyor. Görüntü üretiminden videoya geçen bu dönüşüm, Midjourney’nin yaratıcı üretim alanındaki sınırlarını biraz daha genişletiyor.

Sistem şu an için 5 saniyelik kısa videolar üretme kapasitesine sahip. Kullanıcılar platformda oluşturdukları veya yükledikleri görselleri temel alarak bu kısa klipleri oluşturabiliyor. Yeni eklenen “animate” butonu üzerinden başlatılan işlem, görseli hareketli hale getiriyor. Bu süreçte yapay zekâ varsayılan bir metin komutu kullanarak sahneyi animasyona dönüştürüyor.

Midjourney kullanıcılara hareketin biçimini tanımlama imkanı veriyor

Varsayılan ayarın dışına çıkmak isteyenler için sistemde bir de “manual” seçeneği bulunuyor. Bu özellik sayesinde kullanıcılar, sahnedeki hareketin nasıl gerçekleşeceğini detaylı biçimde tanımlayabiliyor. Kamera hareketleriyle mi, yalnızca objeyle mi hareket edileceği gibi ayarlar manuel kontroller üzerinden belirlenebiliyor. Böylece daha kişisel ve özgün sonuçlar elde etmek mümkün hâle geliyor.

Oluşturulan videolar dört kez, her seferinde dört saniye uzatılabiliyor. Toplamda 21 saniyelik bir klip üretmek mümkün oluyor. Bu uzatma seçeneği, görsel anlatıların daha dinamik ve zengin bir forma dönüşmesini sağlıyor. Hareketin yoğunluğu da “yüksek” ve “düşük” olmak üzere iki ayrı ayarla düzenlenebiliyor.

Yeni araç şu anda yalnızca Midjourney’nin web platformunda ve Discord sunucusu üzerinden kullanılabiliyor. Sisteme erişebilmek için ise ücretli abonelik gerekiyor. Başlangıç seviyesindeki paket, ayda 10 dolara 3,3 saatlik hızlı GPU süresi sunuyor. Bu süreyle yaklaşık 200 görsel üretmek mümkün olsa da video üretimi görsele göre çok daha fazla kaynak tüketiyor.

Midjourney, video başına işlem maliyetinin bir görselin sekiz katı olduğunu belirtiyor. Şirketin ifadesine göre bir saniyelik video, yaklaşık bir görselin işlem maliyeti kadar sistem kaynağı harcıyor. Bu nedenle kullanıcıların video üretimi yaparken işlem süresi hesaplarını dikkatli yapmaları gerekiyor. Özellikle uzun videolar oluşturmak isteyenlerin daha yüksek abonelik planlarına yönelmesi kaçınılmaz görünüyor.

Tüm bunların yanında, Midjourney’nin video üretim girişimi bazı hukuki engellerle karşı karşıya. Disney ve Universal, şirketin telifli içeriklerini izinsiz biçimde yeniden üretebileceğini iddia ederek dava açtı. Özellikle eğitim sürecinde kullanılan veri setlerinin telif haklarını ihlâl etmiş olabileceği ihtimali dikkat çekiyor. Şirket, metin veya görsel üretimlerinde olduğu gibi video modelinin de telifli içeriklerle “beslendiği” gerekçesiyle suçlanıyor.

Disney ve Universal’a göre Midjourney, “sanal bir otomat” gibi sınırsız sayıda lisanssız içerik üretebiliyor. Ocak ayında duyurulan video üretim modelinin o tarihten itibaren zaten telif haklarını ihlâl ettiği savunuluyor. Ne var ki Midjourney’nin kurucusu David Holz, bu ilk versiyonu yalnızca bir geçiş noktası olarak tanımlıyor. Holz’a göre uzun vadede hedef, gerçek zamanlı açık dünya simülasyonları üretebilen sistemlere ulaşmak.

Öte yandan, Midjourney bu alanda yalnız değil. Google, Meta ve OpenAI gibi şirketler de benzer yapay zekâ tabanlı video üretim araçlarını kullanıcıların hizmetine sundu. Sektördeki bu gelişmeler, metin komutlarıyla video üretiminin yakın gelecekte çok daha yaygın bir uygulamaya dönüşeceğini gösteriyor. Özellikle yaratıcı sektörlerde, bu tür araçların profesyonel üretim süreçlerine entegre edilmesi kaçınılmaz hale geliyor.