Използването на данни от YouTube от OpenAI генерира спорове за бъдещето на AI

OpenAI, водещата компания зад ChatGPT, е използвала над милион часа видеа от YouTube, за да обучи най-новия си модел на изкуствен интелект, GPT-4. С цел запазване на конкурентното си предимство в глобалните изследвания в областта на изкуствения интелект, OpenAI използва разнообразни източници и включва обществени данни и партньорства.

Президентът на OpenAI, Грег Брокман, изигра ключовата роля в отбора на видеоматериали за обучението. Вместо да се отказва от потенциалните правни последици, OpenAI разглежда използването на съдържание от YouTube като честно.

В резултат на това разкритие, Google, който е собственик на YouTube, потвърждава, че има непотвърдени съобщения за действията на OpenAI. Те потвърждават, че техните robots.txt файлове и Условия за ползване строго забраняват всякакво неоторизирано сканиране или изтегляне на съдържание от YouTube.

Интересно е, че това не е първият път, в който данни от YouTube се използват за обучение на модели на изкуствен интелект. Майкрософт, в сътрудничество с The Information, използваха данни от YouTube за подобна цел миналата година.

YouTube е известен с обширния си репозиторий от мултимедийно съдържание, включително аудио, изображения и текстови транскрипции. Този изобилие от данни го прави ценен ресурс за обучение на модели на изкуствен интелект. Въпреки това, практиката на обширно събиране на данни от YouTube предизвиква загриженост по отношение на правните и етичните последици, особено в областта на използването на данни и правата върху интелектуалната собственост.

FAQ

1. Какво е честно ползване?
Честното ползване е правен принцип, който позволява ограниченото използване на защитени с авторско право материали без допълнително разрешение от притежателя на авторското право. Важно е да се отбележи, че честното ползване е субективно и се определя въз основа на конкретни случаи, като се взимат предвид факторите като характерът на ползването, количеството използвано от защитената работа, въздействието върху пазара и целта на ползването.

2. Как OpenAI използва данни от YouTube?
OpenAI използва видеа от YouTube за обучението на своите модели на изкуствен интелект, като GPT-4. Чрез анализ на голям брой видеоконтент, включително аудио, изображения и текстови транскрипции, OpenAI цели да подобри възможностите и производителността на своите модели на изкуствен интелект.

3. Какви са правните и етичните опасения, свързани с използването от OpenAI на данни от YouTube?
Неоторизираното събиране на големи обеми данни от YouTube предизвиква загриженост по повод законовите регулации, собствеността и съгласието. Това също подчертава необходимостта от по-ясни насоки и надзор относно използването на данни в научните изследвания в областта на изкуствения интелект. Балансирането на иновациите с поверителността и правата върху интелектуалната собственост е от съществено значение за гарантирането на отговорни и прозрачни практики при събирането на данни.

Източници:
– Google’s robots.txt files and Terms of Service
– Доклад на The Verge (URL: www.example.com)

The source of the article is from the blog maltemoney.com.br