Dôležité pátranie téciovými novinami odhalilo kontroverzné zistenie v oblasti vývoja umelej inteligencie. Priemyselní giganti zamestnávali svoje modely AI trénované na zozname údajov pozostávajúcom z viac ako 173 000 videoklipov z YouTube bez súhlasu.
Zoznam údajov, ktoré viedla nezisková organizácia EleutherAI, obsahuje stručnosti z videí z YouTube získané z viac ako 48 000 kanálov, pričom hráči ako Apple, NVIDIA a Anthropic boli medzi tými, ktorí z neho ťažili. Toto odhaľuje nepríjemnú realitu technológie AI, ktorá ťažko závisí od údajov ťažených z obsahových tvorcov bez ich súhlasu alebo odmeny.
Na rozdiel od originálneho obsahu zoznam údajov neobsahuje žiadne skutočné videoklipy, ale skôr textové údaje od najpopulárnejších tvorcov platformy ako Marques Brownlee a MrBeast, spolu s hlavnými vydavateľmi správ ako The New York Times, BBC a ABC News. Transkripcie z videoklipov od Engadgetu prispievajú aj k tomuto zoznamu údajov, vstupujúc do kontroverznej etickej dilemy v oblasti AI.
Podľa správ Apple získalo data AI z rôznych zdrojov vrátane škrabania údajov z videoklipov na YouTube, čo vyvoláva etické obavy. V dôsledku tohto odhalenia spoločnosti ako Apple a NVIDIA zostávajú ticho na požiadavky o komentár, zdôrazňujúc nedostatok transparentnosti týkajúcej sa údajov využitých na trénovanie modelov AI.
YouTube, ako gigantické zásobárne videí na svetovej úrovni, sa stáva žiadaným bohatstvom pre trénovanie modelov umelej inteligencie, ktoré nie sú obmedzené len na textové údaje, ale rozširujú sa na hlas, video a obrázky. Etické diskusie týkajúce sa využitia údajov z YouTube na trénovanie modelov AI pokračujú v eskalácii, zdôrazňujúc dôležitosť transparentnosti a súhlasu v tomto sa rozvíjajúcom technickom prostredí.