Naujausi perspektyvos AI mokymo šaltinio YouTube duomenims

OpenAI, inovatyvi įmonė, stovinti už ChatGPT, pasinaudojo daugiau nei milijono valandų YouTube vaizdo įrašų, kad išmokytų savo naujausią AI modelį, GPT-4. Išnaudodami įvairius šaltinius ir įtraukdami viešuosius duomenis bei partnerystes, OpenAI siekia išlaikyti konkurencinį pranašumą pasaulinėje AI tyrimų srityje.

OpenAI prezidentas Gregas Brockmanas atliko lemiamą vaidmenį parinkdamas šiuos vaizdo įrašus mokymui. Vietoj to, kad būtų baiminamasi galimų teisinių pasekmių, OpenAI laiko savo naudojimąsi YouTube turiniu kaip teisėtą.

Atsakydami į šį atskleidimą, „Google“, kuris priklauso nuo „YouTube“, pripažino, kad yra nepatvirtintų ataskaitų dėl OpenAI veiksmų. Jie patvirtina, kad jų robots.txt failai ir paslaugų teikimo sąlygos griežtai draudžia bet kokį neleistiną „scraping“ ar „downloadinimą“ iš „YouTube“ turinio.

Įdomu, kad tai nėra pirmas kartas, kai „YouTube“ duomenys buvo naudojami mokyti AI modelius. „Microsoft“ bendradarbiaudamas su „The Information“ panaudojo „YouTube“ duomenis panašiam tikslui praėjusiais metais.

„YouTube“ žinomas dėl savo didelio daugialypio turinio, įskaitant garso, vaizdo ir teksto transkriptus, saugyklos. Šis duomenų gausas jį padaro neįkainojamu ištekliu AI modelių mokymui. Tačiau gausus „YouTube“ duomenų rinkimas kelia susirūpinimą dėl teisinių ir etinių pasekmių, ypač kalbant apie duomenų naudojimą ir intelektinės nuosavybės teises.

OpenAI tvirtina, kad jų naudojimasis patenka į sąžiningo naudojimo sąvoką, tačiau neleistina didelių „YouTube“ duomenų rinkimas kelia klausimus dėl autorių teisių teisės aktų, nuosavybės ir sutikimo reikalo.

Kadangi OpenAI labai priklauso nuo „YouTube“ duomenų, tampa aišku, kad reikalingos aiškios taisyklės ir priežiūra, kad būtų sprendžiami duomenų naudojimo AI tyrimuose ir plėtros klausimai. Bendradarbiavimas tarp AI plėtotojų, platformos savininkų ir turinio kūrėjų yra būtinas nustatant taisykles, kurios derėtų tarp inovacijos ir asmens duomenų apsaugos bei intelektinės nuosavybės teisių.

Dažnai užduodami klausimai

The source of the article is from the blog japan-pc.jp

Privacy policy
Contact