YouTube alt yazıları ile yapay zekâ eğitim sorunu

Apple, Anthropic, Nvidia ve Salesforce gibi büyük teknoloji firmaları, yapay zekâ (AI) sistemlerini eğitmek için YouTube’dan izin alınmadan çekilmiş büyük bir altyazı veri setini kullandı. Proof News ve Wired‘ın ortak araştırmasına göre, bu veri kümesi 170.000’den fazla YouTube videosundan alınan altyazılardan oluşuyor ve 48.000’den fazla kanalın içeriğini kapsıyor. Ancak, bu veri seti yalnızca videolardan alınan altyazılardan ibaret olup görsel içerik içermiyor.

MrBeast ve Marques Brownlee gibi popüler YouTuber’ların videoları, ABC News, BBC ve The New York Times gibi haber kaynaklarının yanı sıra The Verge ve Vox gibi birçok kaynağın videoları bu veri kümesinde yer alıyor. Marques Brownlee, X platformunda yaptığı bir paylaşımda Apple’ın çeşitli şirketlerden yapay zekâları için veri topladığını ve bu şirketlerden birinin YouTube videolarından büyük miktarda veri ve alt yazı topladığını belirtti.

YouTube, bu veri setiyle ilgili yorum yapmayı reddetti. Ancak YouTube CEO’su Neal Mohan, yapay zekâ eğitiminde video içeriği ve transkriptlerin kullanımının platformun kullanım şartlarını ihlal ettiğini söyledi. Google CEO’su Sundar Pichai de bu görüşü destekledi ve yapay zekâ geliştiren şirketlerin YouTube’un kullanım şartlarına uyması gerektiğini belirtti.

İLGİNİZİ ÇEKEBİLİR

Facebook’a yapay zekâ destekli arama ve yeni içerik düzenleme araçları geldi

16 Haz 2026

Anthropic’in iki yapay zekâ modelinin erişime kapatılmasında Amazon’un etkisi tartışılıyor

15 Haz 2026

Bu altyazı veri seti, EleutherAI tarafından oluşturulan The Pile adlı daha büyük bir açık kaynak koleksiyonunun bir parçası. The Pile, kitaplar, Wikipedia makaleleri ve daha fazlasını içeren veri setlerinden oluşuyor. Geçen yıl, Books3 adlı bir veri seti analiz edildiğinde, yazarların eserlerinin yapay zekâ sistemlerini eğitmek için kullanıldığı ortaya çıkmış ve bu durum yazarların şirketlere karşı dava açmasına neden olmuştu.

Yapay zekâ şirketlerinin şeffaflık eksikliği

AI şirketleri, sistemlerini eğitmek için kullandıkları veriler konusunda genellikle şeffaf davranmıyorlar. Özellikle YouTube içeriğinin nasıl kullanıldığı, son aylarda önemli bir soru haline geldi. OpenAI’nin güçlü video üretim aracı Sora’yı tanıttığında, CTO Mira Murati, sistemin YouTube videoları kullanılarak eğitilip eğitilmediği konusunda soruları yanıtsız bıraktı ve yalnızca “kamuya açık veya lisanslı veriler” kullanıldığını belirtti.

Proof News, kullanıcıların içeriklerinin bu veri setinde yer alıp almadığını kontrol edebilecekleri interaktif bir arama aracı sundu. Bu araç, kullanıcıların veya favori YouTuber’larının içeriklerinin bu veri setinde bulunup bulunmadığını görmelerine olanak tanıyor.

⚡️⚡️ BU FIRSATLAR İLGİNİZİ ÇEKEBİLİR ⚡️⚡️

MSI 23.8\" PRO MP243X 1920x1080 (FHD) FLAT IPS 100HZ 1MS ADAPTIVE-SYNC MONITOR

Satın Al

MSI G2712F 27\" Ultra Rapıd 1ms 180Hz Adaptive-Sync IPS Full HD Gaming (Oyuncu) Monitör

Satın Al

Bilgisayarda Kaçmaz Fırsatlar

Satın Al

Seçili Dyson Süpürgelerinde Net İndirim

Satın Al

Seçili Dyson Ürünlerinde 3000 TL İndirim

Satın Al

Game Garaj Elite S67 Amd R5 7500F 32GB Ram 1tb SSD RTX5070 120MM Sıvı Soğt Freedos Oyuncu Oem Paket

Satın Al

Asus Prime Lc 360 Argb 360 mm Intel-Amd Uyumlu Sıvı Soğutucu

Satın Al

Hepsiburada Satıcılı Monitörlerde Sepette %5 Net İndirim

Satın Al

Samsung S26 Ailesi Ürünlerinden Alana Samsung Watch 8 5000 TL İndirimli!

Satın Al

Teknoblog'un satış ortaklıkları vardır. Bunlar, editoryal içeriği etkilemez, ancak Teknoblog, satış ortaklığı bağlantıları üzerinden satın alınan ürünler için komisyon kazanabilir.

Teknoloji şirketlerinin yapay zekâ eğitiminde YouTube altyazılarını kullanması sorun yaratıyor

İLGİNİZİ ÇEKEBİLİR

Facebook’a yapay zekâ destekli arama ve yeni içerik düzenleme araçları geldi

Anthropic’in iki yapay zekâ modelinin erişime kapatılmasında Amazon’un etkisi tartışılıyor

ChatGPT Plus Türkiye fiyatı App Store’da ikiye katlandı

Anthropic Mythos krizi Çin bağlantısı iddiasıyla derinleşti

Claude Fable 5 erişimi bir gecede kapandı

Yapay zekâ şirketlerinin şeffaflık eksikliği

⚡️⚡️ BU FIRSATLAR İLGİNİZİ ÇEKEBİLİR ⚡️⚡️

Qualcomm Snapdragon Reality Elite ile akıllı gözlüklere güç veriyor

Büyük ekran, uzun ömürlü pil, makul fiyat! Lenovo IdeaPad Slim 3 16IRH10 İncelemesi

Lenovo Tab Plus Gen 2 dokuz hoparlörle sahneye çıktı

SpaceX, Cursor için 60 milyar doları masaya koydu

Hisense büyük ekran TV iddiasını Türkiye pazarına taşıyor

İNCELEMELER

Büyük ekran, uzun ömürlü pil, makul fiyat! Lenovo IdeaPad Slim 3 16IRH10 İncelemesi

İnce tasarım, uzun süreli güncelleme garantisi: Samsung Galaxy A57 5G İncelemesi

Yeterince iyi olmak bazen yeterli: Samsung Galaxy A37 İncelemesi

DJI Neo drone için BİM sürprizi: 6.950 TL, stok sınırlı

HarmonyOS 7 cam tasarım ve yüzde 15 hız artışıyla tanıtıldı

Claude Fable 5 erişimi bir gecede kapandı

Apple MacBook Neo, resmi fiyatının 4.540 TL altına inerek yılın en ucuz seviyesine geldi

Galaxy S27 Ultra, S10’dan tanıdık tasarımla Qi2 sorununu aşabilir