Jaunas metodes mākslīgā intelekta apmācībā izraisa etisku debašu

Ievērojama izpēte, ko veica “Technology News”, atklāja kontroversiālu atklāsmi mākslīgā intelekta attīstības jomā. Rūpniecības lieluzņēmumi ir izmantojuši savus AI modeļus, kuri tika apmācīti ar atlasītu datu kopumu, kas satur vairāk nekā 173 000 YouTube video fragmentu, neiesaistoties atļauju.

Datu kopums, ko vadīja nekomerciālā organizācija EleutherAI, satur fragmentus no YouTube video, iegūtiem no vairāk nekā 48 000 kanāliem, kur izmantoja spēlētāji kā Apple, NVIDIA un Anthropic. Tas noder, lai atklātu neērtās realitātes, kā AI tehnoloģijas smagi atkarīgas no datiem, ko iegūst no saturs radītājiem bez viņu atļaujas vai atlīdzības.

Atšķirībā no sākotnējā saturs, datu kopums nesatur faktiskus video fragmentus, bet gan tekstveida datus no augstākās platformas radītājiem, piemēram, Marques Brownlee un MrBeast, kā arī no lielajiem ziņu izdevējiem, piemēram, The New York Times, BBC un ABC News. Engadget video fragmentu transkripcijas arī ietekmē šo datu kopumu, iedziļinoties kontroversiālā ētiskā dilemmā AI ainavā.

Ierocis ziņoja, ka Apple esot iegūstis AI datus no dažādām avotu, tostarp dati no YouTube video fragmentiem, prakse, kas rada ētikas raizes. Šajā atklājumā, uzņēmumi kā Apple un NVIDIA ir klusi pret pieprasījumiem komentāriem, atspoguļojot trūkumu pārredzamībā attiecībā uz datiem, kas tiek izmantoti AI modeļa apmācībai.

YouTube, kā milzīgs globāls video satura rezervuārs, tiek uzskatīts par iegūto zeltu AI modeļu apmācībai, kas neierobežojas ar tekstveida datiem, bet paplašinās līdz balsij, video un attēliem. Ētiskais debates, kas aptver YouTube datu izmantošanu AI modeļa apmācībai, turpina eskalēties, uzsverot pārredzamības un atļaujas nozīmi šajā attīstībai tehnoloģisko ainavā.

Jaunās dimensijas, kas atklātas diskusijās par ētiskajām AI apmācības, nes priekšplānā svarīgas lietas, kuras prasa uzmanību un apsvērumus.

Viena no galvenajām jautājumiem, kas rodas, ir, cik tālu satur radītājiem jākontrolē sava materiāla izmantošana AI apmācībai. Vai vajadzētu izveidot formalizētas vienošanās vai kompensācijas struktūras, lai nodrošinātu godīgu datu izmantošanu, īpaši tad, ja tas nāk no platformām kā YouTube?

Cits svarīgs jautājums attiecas uz pārredzamību, ko ievēro rūpniecības spēlētāji, meklējot datus AI apmācībai. Kā uzņēmumi kā Apple un NVIDIA var uzlabot savus komunikācijas un atklāšanas procesus, lai risinātu ētikas raizes un uzturētu uzticību gan lietotājiem, gan satura radītājiem?

Viena no galvenajām izaicinājumiem, ko saistīts ar lielām datu kopām no platformām kā YouTube, ir potenciāla intelektuālo tiesību pārkāpums. Ētiskā dilemma rodas, kad AI modeļi tiek apmācīti uz datiem, nebūs skaidras atļaujas, radot raizes par privātumu, autortiesībām un īpašuma tiesībām.

Priekšrocības, izmantojot plašus repozitorijus, kā YouTube, AI apmācībā ietver piekļuvi dažādiem un plašiem datiem, kas var uzlabot AI modeļu veiktspēju un iespējas. Tomēr šī priekšrocība tiek kompensēta ar trūkumu ētiskajām implicējumiem un nepieciešamību pēc stingrām ētiskām struktūrām, kas varētu vadīt atbildīgu datu izmantošanu.

Kontroverses, kas saistītas ar YouTube video fragmentu izmantošanu AI apmācībai, uzsver skaidrojušas norādes nozīmi, pieprasot atļauju un nodrošinot atbildību AI attīstības procesā. Tehnoloģiju attīstībai turpinot pārkāpt robežas, kļūst nepieciešams proaktīvi risināt ētikas apsvērumus.

Lai iegūtu plašākas atziņas par ētiskajām dimensijām AI apmācībā un datu izmantošanu, jūs varat izpētīt rakstus vietnē Technology News.

Sparks! | Anja Kaspersen | Good and evil: ethics and fairness in AI, who makes the rules?