Velikani tehnologije obtoženi neavtorizirane rabe vsebine na YouTubu za usposabljanje umetne inteligence

Številni tehnološki velikani, med njimi tudi Apple, se soočajo s pričitovanji, da usposabljajo modele umetne inteligence s pomočjo posnetkov s platforme YouTube brez privoljenja ustvarjalcev vsebine. Namesto da bi pridobili dovoljenje, so te družbe izvlekle podnapise iz več kot 170.000 posnetkov preko aplikacije tretjih oseb.

Prizadeti ustvarjalci, kot so priznani tehnološki videobloger Marquees Brownlee (MKBHD), MrBeast, PewDiePie, Stephen Colbert, John Oliver in Jimmy Kimmel, so bili vsi prizadeti zaradi neavtoriziranega uporabljanja njihove vsebine. Izvlečeni podnapisi so transkripcije video vsebine, kar predstavlja jasno kršitev pravil platforme YouTube.

Razkritje preiskave in ugotovitve

Preiskava Proof News je razkrila, kako so nekatera najbogatejša svetovna podjetja uporabila gradivo iz tisočev video posnetkov s platforme YouTube za usposabljanje svojih modelov umetne inteligence, pri čemer so prezrli pravila platforme. Preiskava je razkrila, da so podnapisi iz 173.536 video posnetkov s platforme YouTube, iz več kot 48.000 kanalov, bili uporabljeni s strani tehnoloških velikanov, kot so Anthropic, Nvidia, Apple in Salesforce.

Prenosi so potekali preko organizacije EleutherAI, neprofitne organizacije, ki pomaga razvijalcem pri usposabljanju jezikovnih modelov. Kljub navedenemu namenu zagotavljanja usposabljanja za majhne razvijalce in akademike, je zbirka podatkov prav tako pristala v rokah velikih tehnoloških podjetij, vključno z Applom.

Uporaba zbirke podatkov Pile

Kot je opisano v raziskovalnem članku, ki ga je objavil EleutherAI, je vprašanje zbirke podatkov del zbirke znanstvenih del, znane kot Pile. Te zbirke so prosto dostopne na internetu za vsakogar, ki razpolaga z zahtevanimi viri in računsko močjo. Ne samo tehnološki velikani, ampak tudi akademiki in razvijalci zunaj velikih tehnoloških podjetij so uporabljali te zbirke podatkov.

Podjetja, kot so Apple, Nvidia in Salesforce, ki se ponašajo s ocenami v višini stotin milijard in bilijonov dolarjev, so v svojih znanstvenih člankih izpostavila, kako so izkoristila Pile za usposabljanje AI modelov. Poročila kažejo, da je Apple Pile uporabil za usposabljanje OpenELM, jezikovnega modela, ki je bil predstavljen aprila, neposredno pred razkritjem novih zmogljivosti umetne inteligence za telefone iPhone in prenosnike MacBook.

Dodatne posledice neavtoriziranega uporabljanja vsebine za usposabljanje umetne inteligence

Medtem ko je začetna preiskava osvetlila široko razširjeno neavtorizirano izvajanje vsebine s platforme YouTube za usposabljanje modelov umetne inteligence, izhajajo iz tega prakse dodatne posledice. Uporaba podnapisov iz video posnetkov s platforme YouTube brez izrecnega privoljenja ustvarjalcev vsebine s strani tehnoloških velikanov odpira več kritičnih vprašanj, ki zahtevajo raziskovanje.

Ključna vprašanja:

1. Pravne posledice: Kakšne so potencialne pravne posledice za tehnološka podjetja, vpletena v neavtorizirano uporabo vsebine s platforme YouTube za usposabljanje umetne inteligence?

Odgovor: Podjetja se lahko soočijo s tožbami zaradi kršitve avtorskih pravic, odškodninami in škodo na ugledu zaradi kršitve intelektualnih pravic ustvarjalcev vsebine brez ustreznega pooblastila.

2. Etične preučitve: Kako neavtorizirana uporaba vsebine vpliva na etične standarde teh tehnoloških velikanov?

Odgovor: Pomanjkanje privoljenja in preglednosti pri uporabi tretje osebne vsebine za razvoj umetne inteligence postavlja vprašanja o etičnih praksah, pravicah do zasebnosti in poštenem nadomestilu za ustvarjalce.

3. Pomisleki o varovanju podatkov: Kakšne posledice ima izvleka podnapisov iz video posnetkov s platforme YouTube na varovanje podatkov in varnost uporabnikov?

Odgovor: Neavtorizirano črpanje video vsebine za usposabljanje umetne inteligence lahko ogrozi zasebnost uporabnikov, saj lahko osebne informacije, ki so vstavljene v podnapise, zlorabijo ali nepravilno ravnajo z njimi.

Izzivi in kontroverze

Poleg kontroverze v zvezi z neavtorizirano uporabo vsebine s platforme YouTube za usposabljanje modelov umetne inteligence se prikažejo več izzivov in kontroverz, ki zahtevajo pozornost in rešitev.

Prednosti:

1. Stroškovna učinkovitost usposabljanja: Dostop do javno dostopnih zbirk podatkov, kot je Pile s platform, kot je YouTube, lahko zmanjša stroške, povezane s pridobivanjem in označevanjem obsežnih količin usposabljalnih podatkov.

2. Povečane zmogljivosti umetne inteligence: Z izkoriščanjem različnih virov vsebin za usposabljanje modelov umetne inteligence lahko tehnološki velikani izboljšajo natančnost in vsestranskost svojih sistemov umetne inteligence za prihodnje razvoje.

Slabosti:

1. Pomanjkanje preglednosti: Skrivnostno izvlečenje video vsebine brez ustreznega pripisa ali privoljenja podira preglednost in odgovornost v procesih razvoja umetne inteligence.

2. Kršitev pravic intelektualne lastnine: Neavtorizirana uporaba avtorskih materialov za usposabljanje umetne inteligence dviga skrb v zvezi z intelektualnimi pravicami in poštenim nadomestilom za ustvarjalce vsebine.

Za več vpogledov o etiki umetne inteligence, varovanju podatkov in tehnoloških predpisih obiščite AoL News.

[vstavi]https://www.youtube.com/embed/aP8yrkkLWlM[/vstavi]

The source of the article is from the blog trebujena.net

Privacy policy
Contact