Teknoloji

Gemini Robotics, İnternet olmadan çalışan cihaz içi yapay zekâ modeliyle test edilmeye başlandı

Google DeepMind, robotların internet bağlantısı olmadan görev yapabilmesini sağlayan yeni bir cihaz içi yapay zekâ modeli üzerinde çalıştığını duyurdu. Şirketin Mart 2024’te tanıttığı Gemini Robotics modelinin daha kompakt ve doğrudan donanım üzerinde çalışabilen versiyonu geliştiricilerle test sürecine alındı. Model, farklı robot türleri üzerinde uyarlanarak görevleri bağlantısız şekilde yerine getirebiliyor. Böylelikle fiziksel görevlerde çevrimiçi veri gereksinimi ortadan kaldırılıyor.

Gemini Robotics’in bu yeni versiyonu, robotların görsel verileri algılayarak hareket komutlarına dönüştürebilmesini mümkün kılan bir yapıya sahip. Görüntü, dil ve hareket ilişkisini temel alan bu sistem, örnekleme yoluyla öğrenme özelliğini de içeriyor. Geliştirici ekibe göre yalnızca 50 ila 100 örnekleme ile robotlar yeni bir senaryoya uyum sağlayabiliyor. Bu durum, özellikle veri bağlantısının sınırlı olduğu ortamlarda kullanım alanını genişletiyor.

Google, bu modelin ilk eğitim sürecini kendi geliştirdiği ALOHA adlı robotla yürüttü. Ancak eğitim sonrasında model, farklı robot türlerinde de başarıyla uygulanabildi. Apptronik tarafından geliştirilen Apollo isimli insan benzeri robot ile Franka FR3 gibi çift kollu sistemlerde aynı yazılım kullanıldı. Modelin farklı donanımlara kolaylıkla entegre edilebilmesi, cihaz içi çalışmayı mümkün kılan yapısal bir avantaj sunuyor.

Gemini Robotics’in cihaz içi modeli farklı robotlara uyarlanarak sahada test ediliyor

DeepMind’in robotik bölümü yöneticisi Carolina Parada, Gemini Robotics’in orijinal versiyonunun hem bulut tabanlı hem de yerel çalışabilecek şekilde tasarlandığını ifade etti. Ancak bu yeni model, yalnızca cihaz üzerinde çalışacak biçimde optimize edildi. Bu nedenle internet bağlantısı gerektirmeyen sistemlerde kullanım açısından daha esnek bir yapı sunuyor. Fakat hibrit modelin işlem kapasitesi bakımından hâlâ daha güçlü olduğu belirtiliyor.

Cihaz içi modelin düşük bağlantı koşullarında veya çevrimdışı çalışması gereken sistemlerde kullanılmak üzere geliştirildiği aktarılıyor. Bu özellik, örneğin güvenlik açısından hassas ortamlarda uygulama potansiyelini artırıyor. Ne var ki DeepMind, modeli şu anda yalnızca sınırlı sayıda geliştiriciyle test ediyor. Bu test süreci boyunca modelin güvenlik ve uyumluluk seviyeleri değerlendiriliyor.

Geliştiricilerin model üzerinde ince ayar yapabilmesi için bir yazılım geliştirme kiti (SDK) de sunuluyor. Bu kit, geliştiricilerin cihaz içi Gemini Robotics modeliyle etkileşimli olarak çalışma yapmasına imkân tanıyor. Böylece modelin farklı kullanım senaryolarına göre yeniden eğitilmesi ya da adapte edilmesi sağlanabiliyor. Google, bu SDK’nın kendi görsel-dil-eylem modelleri arasında ilk kez yayınlandığını belirtiyor.

Yazılımın yeni versiyonunda modelin tümüyle cihaz üzerinde çalışıyor olması enerji verimliliği açısından da önem taşıyor. Bu sayede karmaşık işlem süreçlerinin buluta gönderilmesine gerek kalmıyor. Özellikle düşük güçlü işlemcilerle çalışan robot sistemleri için bu durum belirleyici bir özellik olabilir. Böylelikle enerji ve donanım maliyetlerinde de düşüş sağlanması mümkün hale geliyor.

Bunun yanında, geliştirici ekip modelin adaptasyon kabiliyetine vurgu yapıyor. Eğitim yalnızca ALOHA üzerinde gerçekleştirilmiş olmasına rağmen, yazılımın diğer robot sistemlerine uyarlanmasında önemli bir zorluk yaşanmadığı belirtiliyor. Bu da modelin mimarisinin donanımdan bağımsız olarak genişletilebilir olduğunu gösteriyor. Cihaz içi çalışmaya uygun hale getirilmiş bu yapı, gelecekte benzer çözümler için bir temel oluşturabilir.

Gemini Robotics’in cihaz içi versiyonu henüz genel kullanıma sunulmadı. DeepMind, test sürecinden elde edilen veriler doğrultusunda model üzerinde çeşitli güvenlik ve performans iyileştirmeleri yapmayı planlıyor. Geliştirme çalışmaları ilerledikçe daha geniş kapsamlı erişim olanakları sağlanması bekleniyor. Bu süreçte geliştiricilerin SDK üzerinden elde edecekleri geri bildirimler kritik bir rol üstleniyor.