Uudet tekoälymallit, jotka on koulutettu YouTube-transkriptioiden avulla, herättävät tekijänoikeushuolia

Viimeaikaisessa kehityksessä OpenAI ja Google ovat joutuneet arvostelun kohteeksi kouluttaessaan tekoälymallejaan käyttäen YouTube-videoita transkriptiona, mahdollisesti rikkoen tekijöiden tekijänoikeuksia. The New York Timesin raportti valottaa näiden teknologiagiganttien käytäntöjä ja niiden pyrkimyksiä maksimoida datan syöttö tekoälyjärjestelmiinsä. Vaikka yritykset ovat käyttäneet erilaisia tekniikoita saadakseen suuren määrän dataa, on herännyt kysymyksiä niiden menetelmien laillisuudesta.

OpenAI:n väitetään käyttäneen Whisper-puheentunnistustyökaluaan transkriboimaan yli miljoona tuntia YouTube-videoita, jotka käytettiin uusimman tekstistä-videoon-generaattorinsa, Sora, kouluttamiseen The New York Timesin raportin mukaan. Tämä seuraa aikaisempia väitteitä The Informationilta, jonka mukaan OpenAI oli käyttänyt YouTube-videoita ja podcasteja kouluttaakseen tekoälyjärjestelmiään. On huomionarvoista, että OpenAI:n presidentti Greg Brockman oli raporttien mukaan mukana tässä projektissa.

Myös Googlea koskeviin käytäntöihin on herätetty huolia, koska luvaton raapiminen tai YouTube-sisällön lataaminen on kiellettyä. Googlen edustaja Matt Bryant tarkensi, että yritys ei ollut tietoinen OpenAI:n käytöstä YouTube-videoihin eivätkä tukeneet tällaista toimintaa. Kuitenkin The New York Timesin raportti vihjaa siihen, että Googlella oli henkilöitä tietoisia OpenAI:n käytännöistä, mutta he eivät puuttuneet tilanteeseen, mahdollisesti Googlen oman käytön takia YouTube-videoita kouluttaakseen tekoälymallejaan.

On tärkeää huomata, että Google väittää käyttävänsä videoita vain luojilta, jotka ovat suostuneet osallistumaan heidän kokeelliseen ohjelmaansa. Engadget on ottanut yhteyttä sekä Googleen että OpenAI:hin kommentteja varten tästä asiasta.

UKK

1. Rikkovatko OpenAI ja Google tekijänoikeuksia kouluttaessaan tekoälymallejaan YouTube-transkriptioiden avulla?
On huolia siitä, että OpenAI:n ja Googlen YouTube-videoita käyttäessään tekoälymallejaan he saattavat rikkoa tekijöiden tekijänoikeuksia. The New York Timesin raportti korostaa näitä mahdollisia rikkomuksia ja osoittaa, että luvaton raapiminen tai YouTube-sisällön lataaminen ei ole sallittua. Google kuitenkin väittää käyttävänsä videoita vain luojiin, jotka ovat suostuneet osallistumaan kokeelliseen ohjelmaan.

2. Minkä lähestymistavan OpenAI otti kouluttaessaan tekoälymalliaan?
OpenAI käytti väitetysti Whisper-puheentunnistustyökaluaan transkriboimaan yli miljoona tuntia YouTube-videoita, jotka sitten käytettiin heidän tekstistä-videoon-generaattorinsa, Sora, kouluttamiseen. Tämä lähestymistapa tähtäsi hyödyntämään suurta määrää dataa paremman tekoälymallin suorituskyvyn saavuttamiseksi.

3. Onko Google tunnustanut OpenAI:n YouTube-videoista kouluttamisen?
Google ilmoitti, etteivät he olleet tietoisia OpenAI:n käytöstä YouTube-videoista kouluttaa tekoälymallejaan ja tarkensi, etteivät tue luvatonta raapimista tai sisällön lataamista. Kuitenkin raportin mukaan jotkut Googlen henkilöt tunsivat OpenAI:n käytännöt, mutta eivät toimineet, mahdollisesti johtuen Googlen omasta käytöstä YouTube-videoita kouluttaakseen tekoälymallejaan.

4. Miten Google laajensi yksityisyydensuojakäytäntöjään, kuten raportissa mainitaan?
The NYT raportoi, että Google päivitti yksityisyydensuojakäytäntöjään kesäkuussa 2022 kattamaan laajemman valikoiman julkisesti saatavilla olevaa sisältöä, kuten Google Docs ja Google Sheets, kouluttaakseen tekoälymallejaan ja -tuotteitaan. Google korostaa kuitenkin, että he käyttävät tätä dataa vain käyttäjien nimenomaisella luvalla, jotka osallistuvat heidän kokeellisiin ominaisuuksiinsa.

5. Ovatko OpenAI ja Google antaneet virallisia lausuntoja näistä syytöksistä?
Engadget on ottanut yhteyttä sekä OpenAI:hin että Googleen heidän kommenttejaan varten. Tällä hetkellä kummaltakaan yritykseltä ei ole virallisia lausuntoja The New York Timesin raportissa esille otetuista syytöksistä.

Lisänä artikkelissa annettuun tietoon, tässä on joitain lisätietoja alasta, markkinanäkymistä ja ongelmista liittyen tekoälyalaan ja tekoälymallien kouluttamiseen YouTube-transkriptioiden avulla:

Tekoälyala on kokenut merkittävää kasvua viime vuosina, ja markkinakoon odotetaan saavuttavan 190,61 miljardia dollaria vuoteen 2025 mennessä, MarketsandMarketsin raportin mukaan. Tämä kasvu johtuu lisääntyvästä kysynnästä tekoälyvoimaisten ratkaisujen suhteen eri aloilla, kuten terveydenhuollossa, rahoituksessa, vähittäismyynnissä ja valmistuksessa.

Yksi avainhaaste tekoälyalalla on tarve suurelle määrälle korkealaatuista dataa tekoälymallien tehokasta kouluttamista varten. Yritykset kuten OpenAI ja Google tutkivat jatkuvasti erilaisia datalähteitä, mukaan lukien julkisesti saatavilla oleva sisältö kuten YouTube-videot, parantaakseen tekoälyjärjestelmiensä suorituskykyä.

Kuitenkin YouTube-videoiden käyttö tekoälymallien kouluttamiseen herättää huolia tekijänoikeusrikkomuksista. Luojilla on yksinoikeudet sisältöönsä, mukaan lukien oikeus toisintaa ja jakaa sitä. Luvaton raapiminen tai lataaminen YouTube-videoista ilman luojien suostumusta voi mahdollisesti rikkoa näitä oikeuksia.

Tekijänoikeusrikkomuskysymys tekoälyalalla ei ole uusi. Menneisyydessä on ollut tapauksia, joissa yrityksiä on haastettu oikeuteen käyttääkseen tekijänoikeudella suojattua materiaalia tekoälykoulutusaineistoissaan. Esimerkiksi vuonna 2019 valokuvaaja nosti kanteen suurta tekoälyyritystä vastaan käytettyään hänen tekijänoikeudella suojattua kuvamateriaalia ilman lupaa.

Näiden tekijänoikeuskysymysten käsittelemiseksi yritykset kuten Google ovat toteuttaneet toimenpiteitä varmistaakseen, että he käyttävät vain videoita luojilta, jotka ovat suostuneet osallistumaan kokeellisiin ohjelmiin. Tämä tehdään noudattaakseen tekijänoikeuslakeja ja kunnioittamaan luojien oikeuksia.

YouTube-videoiden käyttö tekoälymallien kouluttamiseen ei ole ainoa kiistanalainen käytäntö alalla. Muita kysymyksiä ovat muun muassa harhaa olevat tekoälyalgoritmit, tietosuojaongelmat ja tekoälypäätöksenteon eettiset vaikutukset.

Tekoälyalan jatkaessa kehittymistään, on keskeistä, että yritykset navigoivat näitä oikeudellisia ja eettisiä näkökohtia varmistaakseen datan vastuullisen ja lainmukaisen käytön tekoälymallien kouluttamisessa.

Lisätietoa tekoälyalasta ja siihen liittyvistä kysymyksistä löydät seuraavilta verkkosivuilta:

– MarketsandMarkets: Tarjoaa markkinatutkimusraportteja ja alananalyysiä eri sektoreille, mukaan lukien.

The source of the article is from the blog shakirabrasil.info

Web Story