Microsoft MAI-Image-1 görsel modeli kullanıma sunuldu

Microsoft, kendi mühendislik ekibi tarafından geliştirilen MAI-Image-1 modelini kullanıma sundu. Ekim ayında tanıtılmış olan bu model, şu anda Bing Image Creator ve Copilot Audio Expressions içinde kullanılmaya başlandı. Microsoft’un açıklamasına göre model, yüksek hızda ve gerçekçi görseller üretmek üzere tasarlandı. Microsoft’ın AI işlerinden sorumlu yöneticisi Mustafa Suleyman, modelin Avrupa Birliği ülkelerinde de kısa süre içinde kullanıma sunulacağını bildirdi.

MAI-Image-1, Microsoft’un uzun süredir sürdürdüğü yapay zekâ yatırımlarının bir sonucu olarak geliştirildi. Model, özellikle ışık yansımaları, doğa manzaraları ve gerçekçi doku ayrıntıları üretme konusunda ön plana çıkıyor. Bunun yanında modelin, daha büyük yapay zekâ sistemlerine göre daha az kaynakla daha hızlı sonuçlar üretmesi hedefleniyor. Microsoft’un paylaştığı teknik bilgilere göre MAI-Image-1, veri işleme sürecinde gelişmiş ışık modelleme yöntemleri ve çok katmanlı derin öğrenme mimarisi kullanıyor. Böylelikle kullanıcılar kısa sürede yüksek çözünürlüklü görseller oluşturabiliyor.

Suleyman, X platformundaki paylaşımında, modelin özellikle gıda ve doğa fotoğraflarında yüksek başarı gösterdiğini belirtti. Bu tür görsellerde ışık ve gölge dengesinin doğal bir biçimde oluşturulduğu ifade edildi. Şirket yetkilileri, bu modelin Copilot’un hikâye modu özelliğiyle birlikte çalışarak yapay zekâ tarafından üretilen sesli anlatımlara eşlik eden görseller üretebileceğini bildirdi. Bu entegrasyonun, kullanıcıların metin ve ses üretim araçlarını görsellerle bir araya getirebilmesini amaçladığı açıklandı.

Microsoft kendi modelleriyle üretim süreçlerinde bağımsızlığı hedefliyor

MAI-Image-1’in geliştirilmesi, Microsoft’un uzun süredir kullandığı OpenAI altyapısından kısmen ayrılma adımlarından biri olarak görülüyor. Şirket, geçtiğimiz yıl kendi ses modeli MAI-Voice-1 ve metin modeli MAI-1-preview’ı tanıtmıştı. Bu iki modelin ardından görsel üretim alanında da tamamen Microsoft tarafından geliştirilen bir çözüm sunulmuş oldu. Ne var ki, Microsoft Copilot hâlâ OpenAI’ın GPT-5 modelini temel alıyor. Bunun yanında, kullanıcılar için Anthropic Claude gibi alternatif modeller de sistemde yer alıyor.

MAI-Image-1’in Bing Image Creator’da DALL-E 3 ve GPT-4o ile birlikte sunulması, kullanıcıların aynı platformda farklı üretim modelleri arasında karşılaştırma yapabilmesine olanak sağlıyor. Böylelikle kullanıcılar, metin girdisine göre en uygun sonucu veren modeli seçebiliyor. Öte yandan modelin LMArena platformundaki erken testlerinde ilk 10 sıralamasına girdiği bildirildi.

MAI-Image-1’in teknik yapısına ilişkin ayrıntılar, daha önce Microsoft’un blogunda paylaşılmıştı. Şirket, modelin özellikle düşük gecikme süresiyle dikkat çeken bir üretim performansına sahip olduğunu belirtiyor. Kullanıcılar kısa metin komutlarıyla karmaşık ışık koşullarına sahip görseller oluşturabiliyor. Fakat modelin geniş kullanıcı kitlesine açılması aşamalı biçimde planlanıyor. Avrupa bölgesinde ise yerel veri koruma standartlarına uyum süreci tamamlandıktan sonra kullanıma sunulması öngörülüyor.

Modelin tasarım sürecinde, yaratıcı sektörlerde görev alan profesyonellerin geri bildirimleri değerlendirildi. Buna göre sistem, tasarım ve reklam alanlarında çalışanların ihtiyaç duyduğu hız ve gerçeklik dengesini sağlamak üzere optimize edildi. Ayrıca görsellerin renk sıcaklığı, ışık yansımaları ve derinlik efektleri üzerinde kullanıcıların daha fazla kontrol sahibi olabilmesi için özel parametreler eklendi. Microsoft, modelin yapay zekâ kaynaklı önyargıların azaltılması yönünde de ek önlemler aldığını belirtti.

Ek olarak, modelin içerik güvenliği sürecine önem verildiği vurgulandı. Görsel üretimi sırasında uygunsuz veya zararlı içeriklerin filtrelenmesi için ek denetim katmanları bulunuyor. Bu yapı, MAI-Image-1’in eğitim sürecinde kullanılan veri kümelerinin çeşitliliğiyle destekleniyor. Bu sayede model, farklı kültürel ve estetik anlayışları daha dengeli biçimde yansıtabiliyor.

Tüm bunların yanında, Microsoft’un bu modelle yalnızca bir ürün tanıtımı değil, aynı zamanda kendi yapay zekâ üretim altyapısını güçlendirme amacı taşıdığı görülüyor. Şirket, Copilot ve Bing gibi servislerinde dış kaynaklara olan bağımlılığı azaltarak, gelecekte daha entegre ve optimize edilmiş bir yapay zekâ ekosistemi oluşturmayı hedefliyor. MAI-Image-1’in genel kullanıma sunulacağı tarih ise 2025’in son çeyreğinde açıklanacak.

📡 Teknoblog'u takip et Teknoloji gündemini kaçırmamak için 📰 Google Haberler'e ekle, 💬 WhatsApp kanalımıza katıl, ▶ YouTube'a abone ol, 📷 Instagram'da ve 𝕏 X'te bizi takip et.

Teknoloji dünyasının gündemini Teknoblog'un bültenleriyle takip edin.