Įvairios technologijų galybės, įskaitant „Apple“, susiduria su kaltinimais, kad moko dirbtinį intelektą naudodamos „YouTube“ vaizdo įrašus be turinio kūrėjų sutikimo. Vietoje leidimo šios kompanijos ištraukė subtitrus iš daugiau nei 170 000 vaizdo įrašų naudodamos trečiosios šalies programą.
Tokios įtakingos pramogų technologijų vlogerio tarsi Marquees Brownlee (MKBHD), MrBeast, PewDiePie, Stephen Colbert, John Oliver ir Jimmy Kimmel, kurie turėjo būti paveikti šio neteisėto jų turinio naudojimo, praneša. Ištraukti subtitrai yra vaizdo turinio transkripcijos, aiškus pažeidimas „YouTube“ politikos.
Atskleidžiant tyrimą ir rezultatus
Ištyrimas, kurį atliko „Proof News“, atskleidė, kaip kai kurios turtingiausios pasaulio kompanijos naudojo medžiagą iš tūkstančių „YouTube“ vaizdo įrašų, treniruodamos savo dirbtinio intelekto modelius, nepaisydamos platformos taisyklių. Tyrimas parodė, kad subtitrai iš 173 536 „YouTube“ vaizdo įrašų, kilusių iš daugiau nei 48 000 kanalų, buvo naudojami technologijų gigantų, tokių kaip Anthropic, Nvidia, Apple ir Salesforce.
Parsisiuntimus atliko EleutherAI, ne pelno organizacija, kuri padeda programuotojams treniruoti kalbos modelius. Nepaisant jų pareikšto tikslo – teikti treniravimo išteklius mažiems programuotojams ir akademikams, duomenų rinkinį taip pat panaudojo didieji technologijų gigantai, įskaitant „Apple“.
Pile duomenų rinkinio naudojimas
Kaip paaiškėjo „EleutherAI“ išleistoje tyrimo analizės medžiagoje, ginčą kelia duomenų rinkinys, vadinamas „Pile“. Šie duomenų rinkiniai yra viešai prieinami bet kam internete, jei tik turi reikiamus išteklius ir skaičiavimo galias. Ne tik technologijų gigantai, bet ir akademikai bei programuotojai ne iš didžiulių technologijų kompanijų yra panaudoję šiuos duomenų rinkinius.
Kompanijos kaip „Apple“, „Nvidia“ ir „Salesforce“, išsižadėjusios vertinimų šimtus milijardus ir trilijonus dolerių, plačiai savo tyrimų dokumentuose nurodė, kaip naudojo „Pile“ tikslams, susijusiems su dirbtinio intelekto treniravimu. Pranešimai rodo, kad „Apple“ naudojo „Pile“ treniruoti „OpenELM“, kalbos modelį, pristatytą balandžio mėnesį, vos prieš pristatant naujus dirbtinio intelekto gebėjimus „iPhone“ ir „MacBook“ įrenginiams.