Yazılım devi Adobe, yapay zekâ teknolojilerine yaptığı yatırımlar nedeniyle hukuki bir krizle karşı karşıya. Şirketin, SlimLM adlı dil modelini eğitirken korsan kitaplardan yararlandığı iddia ediliyor. ABD’nin Oregon eyaletinde yaşayan yazar Elizabeth Lyon’un başlattığı toplu dava önerisi, Adobe’nin telif haklarıyla korunan eserleri yasal izin olmaksızın yapay zekâ eğitimi amacıyla kullandığını öne sürüyor.
Dava dilekçesinde, Adobe’nin SlimLM modelinin eğitiminde kullanılan verilerin kaynağı olarak SlimPajama-627B adlı açık kaynaklı bir veri kümesine dikkat çekiliyor. Bu veri kümesinin, Haziran 2023’te Cerebras tarafından yayınlandığı ve farklı kaynaklardan toplanan içeriklerin birleştirilmesiyle oluşturulduğu belirtiliyor. Ne var ki Lyon ve avukatları, bu veri kümesinin korsan içerik barındıran RedPajama adlı veri kümesinin bir türevi olduğunu iddia ediyor. RedPajama içinde yer alan ve daha önce tartışma konusu olmuş Books3 veri setinin, telif hakkı sahiplerinin izni olmadan 191 binden fazla kitabı içerdiği biliniyor.
Adobe de diğer şirketler gibi Books3 veri setinden dolayı sıkıntı yaşıyor
Books3 veri kümesi, son dönemde farklı teknoloji firmalarının başını ağrıtan bir unsur hâline geldi. Adobe’ye yöneltilen suçlamalar da benzer bir geçmişe dayanıyor. Dava belgelerine göre, SlimPajama veri kümesi RedPajama’nın manipüle edilmiş bir kopyası ve dolayısıyla Books3 veri setindeki eserleri de içeriyor. Lyon, bu kapsamda kendi yazdığı yazarlık rehberlerinin izinsiz olarak veri setine dâhil edildiğini savunuyor.
Tüm bunlara ek olarak, Books3 veri seti daha önce Apple ve Salesforce gibi şirketlerin de benzer suçlamalarla karşı karşıya kalmasına neden olmuştu. Eylül ayında Apple’a karşı açılan bir başka dava, Apple Intelligence modelinin eğitimi sırasında telif haklarıyla korunan içeriklerin izinsiz kullanıldığını öne sürmüştü. Ekim ayında ise Salesforce’un da aynı veri kümesini kullanarak benzer bir ihlale imza attığı iddia edilmişti.
Bu arada, yapay zekâ sektöründe telif hakkı ihlalleriyle ilgili davalar giderek yaygınlaşıyor. Geliştiricilerin modelleri eğitmek için büyük veri setlerine ihtiyaç duyması, bu veri setlerinin içeriğinde yer alan korsan ya da izinsiz materyallerin ciddi hukuki sonuçlar doğurmasına yol açıyor. Örneğin, Claude adlı sohbet botunu eğitirken yazarların eserlerini izinsiz kullandığı gerekçesiyle dava edilen Anthropic, eylül ayında 1.5 milyar dolarlık bir tazminat ödemeyi kabul etmişti. Adobe cephesinden henüz konuyla ilgili bir açıklama gelmiş değil.







