AI ir duomenų įsigijimo iššūkiai technologijų įmonėms

Technologijų įmonės, siekdamos vadovauti dirbtinio intelekto (AI) srityje, susiduria su kritiniu iššūkiu: poreikiu dideliems duomenų kiekiams, kad galėtų apmokyti savo AI modelius. OpenAI, Google ir Meta imtasi abejotinų veiksmų, pasitraukdamos nuo įmonių politikos ir netgi pažeisdamos teisines ribas.

Pavyzdžiui, OpenAI 2021 m. pabaigoje susidūrė su tiekimo problema ir sukūrė „Whisper“, kalbos atpažinimo įrankį, kuris transkribavo garso iš YouTube vaizdo įrašų. OpenAI transkribavo daugiau nei 1 mln. valandų vaizdo įrašų norėdami patobulinti savo AI sistemą, kylant susirūpinimui dėl galimų pažeidimų taisyklių YouTube platformoje.

Meta, „Facebook“ ir „Instagram“ motininė įmonė, ieškojo būdų gauti duomenis, įskaitant diskusijas apie leidyklą „Simon & Schuster“ įsigijimą ir autorių teisių laužymą internete. Google taip pat pasitelkė YouTube vaizdo įrašų transkribojimą ir išplėtė savo paslaugų sąlygas, kad galėtų pasiekti viešai prieinamus Google dokumentus ir kitą internetinį turinį.

Šių technologijų įmonių veiksmai pabrėžia didėjantį priklausomybės nuo interneto informacijos svarbą, norint paskatinti AI tobulėjimą. Tekstai, vaizdai, garsai ir vaizdo įrašai, sukurti žmonių, tapo nepakeičiamais ištekliais apmokytiems AI sistemoms. Kaip AI modeliai tampa galingesni, reikalingas duomenų kiekis nuolat didėja.

Technologijų įmonės susiduria su spaudžiančiu iššūkiu gauti aukštos kokybės duomenų. Nepaisant to, kad internetas anksčiau buvo gausus informacijos šaltinis, AI tobulėjimas reikalauja daugiau įvairių ir išsamesnių šaltinių. Tačiau teisės aktai, pvz., privatumo įstatymai, trukdo įmonėms, pvz., Google ir Meta, išnaudoti vartotojų sukurtą turinį AI tikslais.

Ekspertai prognozuoja, kad technologijų gigantai gali išnaudoti internete prieinamus aukštos kokybės duomenis jau 2026 m. Dėl to įmonės turi ištirti alternatyvius būdus duomenims rinkti, įskaitant sintetinės informacijos kūrimą. Tai reiškia, kad AI modeliai generuoja tekstą, vaizdus ir kodą, kad mokytųsi iš savo išvesties.

OpenAI, Google ir Meta susidūrė su pagundomis dėl duomenų įsigijimo, pabrėždamos savo pastangas kuravimo ir integravimo duomenis į savo AI modelius. OpenAI teigia, kad kiekvienas jos AI modelis turi unikalų duomenų rinkinį, pritaikytą padidinti jų supratimą apie pasaulį. Google pripažįsta naudojasi YouTube turiniu, bet griežtai laikosi susitarimų su kūrėjais, o Meta pabrėžia jos didelį viešai bendraujančių vaizdų ir vaizdo įrašų kolekciją iš Instagramo ir Facebook platformų.

Vis daugiau kūrybinių darbų naudojimas AI įmonių sukelia teisinius ginčus dėl autorių teisių ir licencijavimo. Daugelis prekybos grupių, autorių ir įmonių pateikė komentarus autorių teisių biurui dėl jų darbų naudojimo AI modeliams. Autorių teisių biuras dabar ruošiasi teisės aktų taikymo AI erai gairėms.

AI duomenų dilemma yra kompleksinė problema, kurią sudaro balanso išlaikymas tarp inovacijų ir kūrėjų teisių. Kol technologijų įmonės siekia plėsti pažangius AI sistemas, duomenų paieškos kelias toliau evoliucionuos, sukeldamas nuolatinius ginčus dėl etiškų ir teisinių ribų.

DUKThe source of the article is from the blog radardovalemg.com

DUK
The source of the article is from the blog radardovalemg.com