Yeni Nesil Yapay Zeka Eğitiminde Telif Hakkı İhlali Olmaksızın Potansiyelin Kilidini Açma

Mart 21, 2024
by
Unlocking the Potential of AI Training without Copyright Infringement

Yapay Zeka (YZ) modelleri uzun zamandır telif hakkıyla korunan materyaller kullanılarak eğitiliyordu, ancak son gelişmeler, bu modellerin fikri mülkiyet haklarını ihlal etmeden eğitilmesi için alternatif yollar olduğunu gösteriyor. Fransız hükümeti tarafından desteklenen bir grup araştırmacı, tamamen genel kullanıma açık metinden oluşan önemli bir YZ eğitim veri seti yayınladı. Bu çığır açıcı veri seti, telif hakkı olmayan materyallerin kullanımı olmadan büyük dil modellerinin eğitilebileceğini kanıtlıyor.

Kâr amacı gütmeyen kuruluş Fairly Trained, ilk büyük dil modeli olan KL3M’i başarıyla sertifikalandığını duyurdu. Bu model, Chicago merkezli bir hukuk teknolojileri danışmanlık şirketi olan 273 Ventures tarafından geliştirildi ve hukuki, finansal ve düzenleyici belgelerden oluşan özenle hazırlanmış bir eğitim veri seti kullanılarak eğitildi. Telif haklarına uyuldu ve kendi veri setlerini kullandılar ve 273 Ventures, büyük dil modellerini oluşturmanın telif hakkı ihlali sorununu aşmanın mümkün olduğunu kanıtladı.

273 Ventures’ın kurucu ortağı Jillian Bommarito’ya göre, KL3M’i kendi veri setlerini kullanarak eğitme kararı, hukuk endüstrisindeki riskten kaçınan müşterilerinin endişeleri tarafından yönlendirildi. Müşteriler verinin kaynağı ile ilgili endişeliydi ve YZ modelinin taintli veya telif hakkına tabi verilere dayandığına dair güvenceler istediler. Bommarito, modelin boyutunun ezici derecede büyük olmasına gerek olmadığını vurgulayarak, yüksek kaliteli verinin daha iyi performans ve uzmanlaşma sağlayabileceğini önemli bir şekilde belirtiyor.

Şu anda OpenAI gibi endüstri devlerince derlenen veri setleriyle karşılaştırıldığında KL3M gibi veri setleri boyut bakımından kısıtlı olabilir, ancak gelecek için umut var. Araştırmacılar yakın zamanda Commons Corpus’u yayınladı, dil modelleri için şimdiye kadar en büyük genel kullanıma açık içerik veri seti olduğunu iddia ettikleri. Bu veri seti, ABD Kongre Kütüphanesi ve Fransa Ulusal Kütüphanesi gibi kurumlar tarafından dijitalleştirilen genel kullanıma açık gazete metinlerini içerir. Commons Corpus, araştırmacılara ve başlangıçlara, telif hakkı endişelerinden uzak, kontrol edilmiş bir eğitim seti sunmayı amaçlamaktadır.

Genel kullanıma açık içerikten oluşan veri setlerinin, eski bilgiler gibi sınırlamaları olsa da, büyük dil modellerinin eğitimi için değerli bir kaynak sunduğunu söylemek mümkündür. Commons Corpus ve KL3M gibi projeler, YZ topluluğunda telifsiz veri kazanımı argümanına karşı artan bir şüpheciliği gösteriyor. Aslında, Fairly Trained son zamanlarda AI ses modelleri sunan ilk şirketini sertifikalandırdı, bu da endüstride doğru lisanslama almanın ve fikri mülkiyet haklarına saygı göstermenin artan bir trend olduğunu gösteriyor.

Sources: Bu Anlamda hiçbir URL bulunmamaktadır.

Sık Sorulan Sorular (SSS)

The source of the article is from the blog cheap-sound.com

Privacy policy
Contact

Don't Miss

Japan Boosts AI Development with Substantial Supercomputer Investment

Japonya, Büyük Süper Bilgisayar Yatırımıyla Yapay Zeka Gelişimini Destekliyor.

Yeni Süper Bilgisayarlarla Yerli Yapay Zeka Yeteneklerinin Güçlendirilmesi Japon Ekonomi,
A New Era of Digital Learning for Children

Bir Yeni Dönem: Çocuklar İçin Dijital Öğrenme

Çocuklar, öğrenmenin yenilikçi dijital araçlar vasıtasıyla devrimselleştiği bir dünyaya adım