Uusi Teknologia: Koneoppiminen ja Tiedon Himo

Teknologiayritykset kuten OpenAI, Google ja Meta ovat kilpailussa johtopaikasta tekoälyn (A.I.) maailmassa ja kohtaavat haasteita hankkiessaan tarvittavaa digitaalista dataa teknologiansa kehittämiseen. Tässä artikkelissa tarkastellaan näiden yritysten käyttämiä strategioita, mahdollisia sääntöjen ja lakien rikkomisia sekä kasvavaa tiedon janon merkitystä A.I.-alalla.

OpenAI, tunnettu voimakkaista A.I.-malleistaan, törmäsi tarjontahaasteeseen loppuvuodesta 2021, kun se oli käyttänyt loppuun kaikki arvostetut englanninkieliset tekstilähteet internetissä kouluttaakseen A.I.-järjestelmäänsä. Ratkaistakseen tämän ongelman OpenAI:n tutkijat kehittivät puheentunnistustyökalun nimeltä Kuiskaus. Tämän työkalun tarkoituksena oli transkriptoida ääntä YouTube-videoista tuottaen siten uutta keskustelutekstiä, joka voisi parantaa heidän A.I.-järjestelmänsä kykyjä.

Kuitenkin OpenAI:ssa heräsi huolia mahdollisesta YouTube-sääntöjen rikkomisesta käyttämällä heidän videoitaan tähän ”itsenäiseen” sovellukseen. Huolimatta huolista, OpenAI:n tiimi, jota johti Greg Brockman, OpenAI:n presidentti, jatkoi yli miljoonan tunnin YouTube-videoitten transkriboimista. Tuloksena syntyneitä tekstejä käytettiin sitten GPT-4:n kouluttamiseen, yhteen maailman voimakkaimmista A.I.-malleista, ja perustana ChatGPT-keskusteluavustajan uusimmalle versiolle.

Samanlailla Meta (entinen Facebook) harkitsi kustantamon Simon & Schusterin ostamista saadakseen pääsyn pitkiin kirjateoksiin. Yritys keskusteli myös tekijänoikeuksilla suojatun datan eristämisestä eri internet-lähteistä, ollessaan valmis kohtaamaan oikeudellisia taisteluita sen sijaan, että neuvottelisi lisensseistä kustantajien ja sisällöntuottajien kanssa.

A.I.-mallien kehityksessä on tapahtunut merkittävä muutos viime vuosina. Ennen vuotta 2020 mallit kuten GPT-2 nojasivat suhteellisen pieniin koulutusdatamääriin. Kuitenkin GPT-3:n julkaisun myötä tutkijat alkoivat sisällyttää paljon suurempia datasettejä, tunnustaen datavolyymin tärkeyden mallien tehokkaassa kouluttamisessa.

Kun A.I.-ala jatkaa rajojen työntämistä, valtavien tietomäärien hankinta on tullut kriittiseksi edistysaskeleiden kannalta. Yritykset kuten OpenAI ja Meta ovat valmiita rikkomaan rajoja, mahdollisesti taivuttamalla sääntöjä ja ottamaan juridisia riskejä täyttääkseen data-vaatimuksensa. Keskustelu eettisistä ja oikeudellisista näkökohdista datan hankinnassa A.I.-alalla todennäköisesti jatkuu teknologian edetessä.

Tutkiaksesi aihealuetta lisää, voit viitata seuraaviin lähteisiin:
– The New York Times: www.nytimes.com
– Epoch: www.epoch.com

[upota]https://www.youtube.com/embed/5t1vTLU7s40[/upota]

UKK:

K: Mikä on A.I.?
V: A.I. tulee sanoista ”tekoäly”, ja se viittaa tietokonejärjestelmien kehittämiseen, jotka pystyvät suorittamaan tehtäviä, jotka normaalisti vaativat inhimillistä älykkyyttä.

K: Mikä on GPT-4?
V: GPT-4 on yksi tehokkaimmista A.I.-malleista, jonka on kehittänyt OpenAI. Se tarkoittaa Generative Pre-trained Transformer 4 ja sitä käytetään tuottamaan ihmismäistä tekstiä annettujen ohjeiden perusteella.

K: Mitä ovat ChatGPT ja Kuiskaus?
V: ChatGPT on OpenAI:n kehittämä chatbotti, joka perustuu GPT-malleihin. Kuiskaus on puheentunnistustyökalu, jonka OpenAI on luonut transkriboimaan ääntä YouTube-videoista.

The source of the article is from the blog jomfruland.net

Web Story