ManşetlerTeknoloji

Microsoft, şimdiye kadarki en küçük yapay zeka modeli Phi-3’ü tanıttı

Microsoft, şimdiye kadarki en küçük yapay zeka modeli Phi-3’ü tanıttı
Haberleri Kaçırma! Teknoblog'u Google Arama'da tercihli kaynağın yap ve En Çok Okunan Haberler'de bizi daha sık gör.
Tercihli Kaynak Ekle

Microsoft, bu haftanın hemen başında, yeni yapay zeka modeli Phi-3 Mini’yi tanıttı. Bu model, şirketin planladığı üç küçük modelden ilki olarak dikkat çekiyor. Phi-3 Mini, 3.8 milyar parametre ile eğitilmiş ve büyük dil modellerine göre daha küçük bir veri seti kullanılarak hazırlandı.

Şirket, Phi-3 Mini’yi Azure, Hugging Face ve Ollama platformlarında kullanıma sundu. Ayrıca, Phi-3 Small (7 milyar parametre) ve Phi-3 Medium (14 milyar parametre) modellerini de piyasaya sürmeyi planlıyor. Parametreler, bir modelin anlayabileceği karmaşık talimatların sayısını ifade ediyor.

Microsoft Phi-3 Mini: Küçük boyut, büyük işlevsellik

Microsoft’un AI Platformu Kurumsal Başkan Yardımcısı Eric Boyd, Phi-3 Mini’nin GPT-3.5 gibi büyük dil modelleri (LLM) kadar yetenekli olduğunu belirtti ve “daha küçük bir form faktöründe aynı kapasiteye sahip” olduğunu ifade etti. Bu modellerin büyük kardeşlerine göre daha ucuza çalıştırılabilmesi ve kişisel cihazlarda daha iyi performans göstermesi gibi avantajları bulunuyor.

Bu yılın başlarında The Information, Microsoft’un hafif yapay zeka modellerine odaklanacak özel bir ekip kurduğunu bildirmişti. Phi serisi yanı sıra, matematik problemlerini çözmek için tasarlanmış Orca-Math modelini de geliştiren şirket, bu alanda önemli adımlar atıyor.

Rakip şirketler de kendi küçük yapay zeka modellerini geliştiriyorlar. Örneğin, Google’ın Gemma 2B ve 7B modelleri basit sohbet botları ve dil ile ilgili çalışmalar için uygundur. Anthropic’in Claude 3 Haiku modeli yoğun araştırma makalelerini hızlıca özetleyebilir, Meta’nın yeni çıkan Llama 3 8B modeli ise bazı sohbet botları ve kodlama yardımcıları için kullanılabilir.

Boyd, Phi-3’ün eğitimi için “müfredat” tabanlı bir yaklaşım benimsediklerini belirtti. Geliştiriciler, çocukların yatmadan önceki hikayelerden, daha basit kelimelerle yazılmış kitaplardan ve geniş konuları ele alan cümle yapılarından nasıl öğrendiklerinden ilham aldılar. Boyd, “Yeterli çocuk kitabı olmadığı için, Phi’yi eğitmek için bir LLM’den 3000’den fazla kelime kullanarak ‘çocuk kitapları’ yapmasını istedik,” dedi.

Phi-3, önceki sürümlerin üzerine yeni özellikler ekleyerek daha da gelişti. Phi-1 kodlama üzerine yoğunlaşmışken, Phi-2 mantık yürütme yeteneğini geliştirmeye başlamıştı. Phi-3, kodlama ve mantık yürütme konularında daha yetenekli hale geldi. Ancak, genel bilgi birikimine sahip olmasına rağmen Phi-3, GPT-4 gibi tam biçimde internet üzerinde eğitilmiş büyük bir modelin verdiği yanıtların çeşitliliği ile yarışamaz gibi görünüyor.

KÜÇÜK EV ALETLERİNDE FIRSATLAR

Küçük Ev Aletlerinde Premium\'a Özel Sepette %5 İndirim Fırsatı
Seçili Vantilatörlerde Premium\'a Özel Sepette Net indirim!
Seçili Televizyonlarda Premiuma Özel Sepette %5 Net İndirim!
Roborock Markalı Süpürgelerde Sepette %8 İndirim!
Arnica GH21480 Diamond Blender Set

Teknoblog'un satış ortaklıkları vardır. Bunlar, editoryal içeriği etkilemez, ancak Teknoblog, satış ortaklığı bağlantıları üzerinden satın alınan ürünler için komisyon kazanabilir.