Teknoloji

Gemini Live artık ekran üzerinden nesne işaretleyebiliyor

google gemini live

Google, Gemini Live için dikkat çekici yenilikler duyurdu. Bu yenilikler, yapay zekâ asistanını yalnızca sesli yanıt veren bir araç olmaktan çıkarıyor. Bunun yerine, görsel ve işitsel deneyimlerin birleştiği çok yönlü bir asistan ortaya çıkıyor. Kullanıcılar bu sayede günlük hayatlarında daha pratik çözümler elde ediyor. Konuyla ilgili duyuru Made By Google etkinliğinde yapıldı.

Görsel yönlendirme özelliği, bu güncellemelerin en dikkat çekenlerinden biri oldu. Kullanıcılar telefon kameralarını herhangi bir nesneye çevirdiğinde, Gemini Live doğrudan o nesneyi ekranda işaretleyebiliyor. Ne var ki bu özellik yalnızca bir detay değil, aynı zamanda kullanıcı deneyimini derinleştiren bir adım olarak görülüyor. Örneğin bir alet kutusu içinde doğru aracı seçmek isteyen kişi, kararsız kalmadan uygun seçeneği bulabiliyor. Bunun yanında, bu yöntem öğrenme süreçlerinde de fayda sağlayabilir.

Google Gemini Live kullanıcıların ekranına nesne işaretleyebiliyor

Bu özellik ilk olarak 28 Ağustos’ta piyasaya çıkacak Pixel 10 cihazlarıyla birlikte kullanıma açılacak. Google, aynı gün içinde diğer Android cihazlara da dağıtım yapacağını açıkladı. Buna rağmen iOS tarafında biraz daha beklemek gerekecek çünkü şirket bu desteği birkaç hafta içinde devreye alacağını belirtiyor. Tüm bunların yanında, cihaz fark etmeksizin geniş kitlelerin kısa sürede erişim sağlayacağı anlaşılıyor. Bu yaklaşım, Google’ın güncellemeyi hızlı şekilde yaymak istediğini gösteriyor.

Gemini Live yalnızca görsel işaretleme ile sınırlı kalmıyor. Google, asistanı Mesajlar, Telefon ve Saat gibi temel uygulamalarla entegre etmeye hazırlanıyor. Bu entegrasyon, kullanıcıların gündelik işlerini daha az kesintiyle sürdürmesine destek verecek. Örneğin rota tarifi alırken aynı zamanda bir arkadaşına mesaj göndermesi gerekebilir. İşte bu noktada asistan araya girerek tek bir komutla her iki işi de gerçekleştirebilir.

Kullanıcı deneyiminde kesintisiz akış sağlanması hedefleniyor. Diyelim ki kullanıcı yol tarifi alıyor ve geç kalacağını fark etti. Gemini Live’a “Bu rota uygun, şimdi Alex’e 10 dakika gecikeceğimi yaz” dediğinde, asistan mesaj taslağını hazırlıyor. Bunun yanında, onay aldıktan sonra mesajı doğrudan gönderebiliyor. Bu özellik zamandan tasarruf sağlarken, aynı zamanda kullanım kolaylığını artırıyor. Fakat güvenli mesajlaşma altyapısının önemi bu noktada tekrar gündeme geliyor.

Google, bu geliştirmelerin yanında ses modelini de yeniliyor. Şirket, yeni modelin insan konuşmasındaki ritim, vurgu ve tonlamayı daha doğal taklit edeceğini belirtiyor. Böylece Gemini Live konuşulan konunun duygusuna uygun bir ton kullanabiliyor. Stresli bir konu gündeme geldiğinde daha sakin bir ses tonu duyuluyor. Eğlenceli bir hikâye istendiğinde ise daha enerjik bir tonlama ön plana çıkıyor.

Bununla birlikte kullanıcılar, asistanın konuşma hızını da ayarlayabilecek. Daha hızlı ya da daha yavaş konuşma seçeneği, farklı alışkanlıklara sahip kişiler için yararlı olacak. Tüm bunların yanında, belirli bir karakterin ya da tarihî bir kişinin ağzından anlatım istendiğinde Gemini Live buna uygun bir aksan seçebilecek. Bu durum hikâyelerin daha ilgi çekici bir hale gelmesine katkı sağlayacak. Özellikle eğitim ve yaratıcı içerik alanlarında farklı bir deneyim sunabilecek.

Gemini Live’ın ses alanındaki bu gelişmeleri, ChatGPT’nin ses moduyla karşılaştırmalar yapılmasına yol açıyor. Her iki platform da daha doğal bir yapay zekâ deneyimi sağlamak için benzer adımlar atıyor. Yine de Google’ın aksan ve tempo gibi kişiselleştirme detaylarına odaklanması dikkat çekiyor. Kullanıcıların farklı senaryolarda kendilerini daha iyi ifade etmesine yardımcı olacağı öngörülüyor. Bunun yanında, çeşitlenen bu özellikler günlük kullanımda yapay zekâya olan bağımlılığı artırabilir.

Her ne kadar bu yenilikler heyecan verici olsa da, gizlilik ve veri güvenliği soruları da beraberinde geliyor. Görsel yönlendirme ve uygulama entegrasyonları kullanıcı verilerini daha fazla işliyor. Buna rağmen Google, verilerin güvenliğini sağlamak için gerekli önlemleri aldığını vurguluyor. Kullanıcıların bu sürece nasıl tepki vereceği ise ilerleyen dönemde daha netleşecek. Öte yandan güvenlik ve işlevsellik arasındaki denge bu tür teknolojiler için kritik olmaya devam ediyor.