Spennande bruk av YouTube i AI-trening vekker opphavsrettslege spørsmål

I ei nyleg utvikling har OpenAI og Google hamna under lupen for å trene AI-modellane sine ved hjelp av transkripsjonar av YouTube-videoar, noko som potensielt bryt med opphavsrettane til skaparar. Rapporten frå The New York Times kastar lys over praksisen til desse teknologigigantane og deira innsats for å maksimere datatilførselen til AI-systema deira. Sjølv om selskapa har nytta ulike teknikkar for å skaffe store mengder data, er det reist spørsmål om lovligheten til metodane deira.

OpenAI skal ha brukt verktøyet sitt Whisper for talegjenkjenning til å transkribere over éin million timar med YouTube-videoar, som så vart nytta til å trene den nyaste tekst-til-video-generatoren deira, Sora, ifølgje The New York Times-rapporten. Dette kjem etter tidlegare påstandar frå The Information om at OpenAI hadde nytta YouTube-videoar og podkastar til å trene AI-systema deira. Særleg OpenAI sin president, Greg Brockman, skal ha vore involvert i dette prosjektet.

Det er òg reist bekymringar om praksisen til Google, sidan uautorisert skraping eller nedlasting av innhald frå YouTube er forbode. Google sin talsperson, Matt Bryant, presiserte at selskapet ikkje var klar over OpenAI si bruk av YouTube-videoar og stadfesta at dei ikkje godtek slike handlingar. Likevel tyder The New York Times-rapporten på at det var enkeltpersonar hos Google som var klar over OpenAI si praksis, men som ikkje gjorde greie for det, mogleg på grunn av Google si eiga bruk av YouTube-videoar for å trene AI-modellane sine.

Det er viktig å merke seg at Google hevdar at dei berre bruker videoar frå skaparar som har samtykt til å delta i det eksperimentelle programmet deira. Engadget har teke kontakt med både Google og OpenAI for deira kommentarar angåande dette spørsmålet.

Vidare avdekkar The New York Times-rapporten at Google reviderte personvernpolitikken sin i juni 2022 for å omfatte eit breiare spekter av offentleg tilgjengeleg innhald, som Google Docs og Google Sheets, til å trene AI-modellane og produkta deira. Bryant understreka imidlertid at dette berre skjer med uttrykkeleg samtykke frå brukarar som vel å delta i Googles eksperimentelle funksjonar. Han sa også at endringa i politikken ikkje førte til at dei begynte å trene AI-modellane sine på ytterlegare datakjelder.

### Ofte stilte spørsmål

1. Bryt OpenAI og Google opphavsrettar ved å trene AI-modellane sine med YouTube-transkripsjonar?
Det er bekymringar for at bruket av YouTube-videoar av OpenAI og Google for trening av AI-modellane deira kan krenke opphavsrettane til skaparar. The New York Times-rapporten peikar på desse moglegheitene for brot, og indikerer at uautorisert skraping eller nedlasting av innhald frå YouTube ikkje er tillate. Likevel hevdar Google at dei berre bruker videoar frå skaparar som har samtykt til å delta i eit eksperimentelt program.

2. Kva tilnærming tok OpenAI i treninga av AI-modellen deira?
OpenAI skal visstnok ha nytta Whisper talegjenkjenningsteknologien deira til å transkribere meir enn éin million timar med YouTube-videoar, som så vart nytta til å trene tekst-til-video-generatoren deira, Sora. Denne tilnærminga hadde som mål å utnytte ei stor mengd data for betre ytelse i AI-modellen.

3. Har Google stadfesta OpenAI si bruk av YouTube-videoar til trening?
Google uttalte at dei ikkje var klar over OpenAI si bruk av YouTube-videoar til trening av AI-modellane deira og presiserte at dei ikkje støttar uautorisert skraping eller nedlasting av innhald. Rapporten antyder imidlertid at nokre enkeltpersonar hos Google var klar over OpenAI si praksis, men ikkje gjorde noko, mogleg på grunn av Google si eiga bruk av YouTube-videoar til trening av AI-modellane deira.

4. Korleis utvida Google personvernpolitikken sin, som nemnt i rapporten?
NYT-rapporten avdekkar at Google oppdaterte personvernpolitikken sin i juni 2022 for å inkludere eit breiare spekter av offentleg tilgjengeleg innhald, som Google Docs og Google Sheets, til å trene AI-modellane og produkta deira. Google understrekar imidlertid at dei berre bruker desse dataene med uttrykkeleg samtykke frå brukarar som vel å delta i dei eksperimentelle funksjonane deira.

5. Har OpenAI og Google kome med offisielle utsegner vedrørande desse påstandane?
Engadget har teke kontakt med både OpenAI og Google for deira kommentarar angåande saka. Per no har det ikkje kome offisielle utsegner frå kvarken selskap om påstandane som vart reist i The New York Times-rapporten.

I tillegg til informasjonen gitt i artikkelen finn du her ekstra detaljar om bransjen, marknadsprognosar og problem knytt til AI-bransjen og trening av modellar ved bruk av YouTube-transkripsjonar:

AI-bransjen har opplevd betydeleg vekst dei siste åra, og marknaden forventes å nå 190,61 milliardar dollar innan 2025, ifølgje ein rapport frå MarketsandMarkets. Dette vekst blir drivne av auka etterspurnad etter AI-drevne løysingar i ulike sektorar som helsevesen, finans, detaljhandel og produksjon.

Ei av dei største utfordringane i AI-bransjen er behovet for store mengder høgkvalitetsdata for å trene AI-modellar effektivt. Selskap som OpenAI og Google utforskar stadig ulike datakjelder, inkludert offentleg tilgjengeleg innhald som YouTube-videoar, for å forbetre ytelsen til AI-systema sine.

Likevel reiser bruken av YouTube-videoar for trening av AI-modellar spørsmål om opphavsrettsbrotsverk. Skaparane har eksklusive rettar til innhaldet sitt, inkludert retten til å reprodusere og distribuere det. Uautorisert skraping eller nedlasting av YouTube-videoar utan skaparanes samtykke kan potensielt bryte desse rettane.

Problemet med opphavsrettsbrot i AI-bransjen er ikkje nytt. Tidlegare har det vore saker der selskap vart søksmålsdømde for å bruke opphavsrettsleg materiale i AI-treningsdataane sine. Til dømes i 2019 saksøkte ein fotograf eit stort AI-selskap for å ha brukt bileta hans utan løyve.

For å adressere desse opphavsrettsbekymringane har selskap som Google implementert tiltak for å sikre at dei berre bruker videoar frå skaparar som har samtykt til å delta i dei eksperimentelle programma deira. Dette er gjort for å overhalde opphavsrettslovar og respektere skaparane sine rettar.

Likevel er ikkje bruken av YouTube-videoar for trening av AI-modellar den einaste kontroversielle praksisen i bransjen. Andre problemstillingar inkluderer skjevhet i AI-algoritmar, bekymringar om personvern og dei etiske implikasjonane av AI-beslutningsprosessar.

Som AI-bransjen held fram med å utvikle seg, er det avgjerande for selskapa å navigere gjennom desse juridiske og etiske omsyna for å sikre ansvarleg og lovleg bruk av data i trening av AI-modellar.

For meir informasjon om AI-bransjen og relaterte problemstillingar, besøk følgjande nettstader:

– [MarketsandMarkets](https://www.marketsandmarkets.com/)

The source of the article is from the blog crasel.tk