Utilizarea datelor de pe YouTube de către OpenAI pentru instruirea modelului lor AI GPT-4

OpenAI, compania pionieră din spatele ChatGPT, a utilizat peste un milion de ore de videoclipuri de pe YouTube pentru a instrui cel mai recent model AI al lor, GPT-4. Prin valorificarea unei game largi de surse și integrarea datelor publice și a parteneriatelor, OpenAI își propune să-și mențină avantajul competitiv în cercetarea globală în domeniul inteligenței artificiale.

Președintele OpenAI, Greg Brockman, a avut un rol crucial în selecționarea acestor videoclipuri pentru instruire. În loc să se eschiveze de la posibilele implicări legale, OpenAI consideră utilizarea conținutului de pe YouTube ca fiind în conformitate cu principiile fair use.

În urma acestei revelații, Google, compania care deține YouTube, a recunoscut că există rapoarte neconfirmate referitoare la acțiunile OpenAI. Aceștia reafirmă faptul că fișierele lor robots.txt și Termenii de Serviciu interzic strict orice raclarea neautorizată sau descărcarea de conținut de pe YouTube.

În mod interesant, aceasta nu este prima dată când datele de pe YouTube sunt folosite pentru instruirea modelelor AI. Microsoft, în colaborare cu The Information, a utilizat date de pe YouTube în scopuri similare anul trecut.

YouTube este cunoscut pentru vasta sa bază de date multimedia, care include conținut audio, imagini și transcrieri de text. Acest bogat conținut de date îl face o resursă inestimabilă pentru instruirea modelelor AI. Cu toate acestea, practica de a colecta în mod extensiv date de pe YouTube ridică probleme legale și etice, în special în ceea ce privește utilizarea datelor și drepturile de proprietate intelectuală.

OpenAI susține că utilizarea lor intră sub incidența principiilor fair use, dar colectarea neautorizată a unor cantități uriașe de date de pe YouTube ridică întrebări cu privire la reglementările privind drepturile de autor, proprietatea și consimțământul.

Întrucât OpenAI se bazează în mare măsură pe datele de pe YouTube, devine evident că sunt necesare linii clare directoare și supraveghere pentru a aborda utilizarea datelor în cercetarea și dezvoltarea AI. Colaborarea dintre dezvoltatorii de AI, proprietarii de platforme și creatorii de conținut este crucială pentru stabilirea unor directive care să găsească un echilibru între inovație și protejarea confidențialității și a drepturilor de proprietate intelectuală.

Întrebări frecventeThe source of the article is from the blog procarsrl.com.ar

Întrebări frecvente
The source of the article is from the blog procarsrl.com.ar