New Perspectives on AI Data Licensing

Photobucket, tidlegare ein leiar innan bilethosting på 2000-talet, har sett ein signifikant nedgang i brukarar gjennom åra. Men selskapet kan no ha fått nytt liv når dei utforskar moglegheiten til å lisensiere sin massive samling på 13 milliardar bilete og videoar til generative AI-modelltrening.

Administrerande direktør Ted Leonard avslørte at Photobucket for tida er i samtalar med fleire teknologiselskap om lisensiering av innhaldet sitt. Generative AI-modellar er avhengige av store datasett for å lære og generere nytt innhald som svar på tekstoppgåver. Dei potensielle avtalane som er diskutert, har variert frå 5 cent til $1 per bilete og over $1 per video, med prisar som varierer avhengig av kjøparen sine krav.

Medan Photobucket ikkje har oppgitt kven dei potensielle kjøparane er på grunn av forretningsmessig konfidensialitet, aukar desse forhandlingane kjennskapen til det framvoksende datamarknaden rundt generative AI-teknologi. Teknkjemper som Google, Meta og Microsoft-støtta OpenAI sat tidlegare på gratis nettdata for å trene AI-modellane sine. No utforskar dei betalte alternativ, inkludert lisensiering av innhald som er blokkert bak betalingsmurer og innloggingsskjermar.

Advokatfirmaet Klaris Law opplyste om at dei har hjulpe eigarar av innhald med lisensieringsavtalar til ein verdi på titals millionar dollar, noko som gjer selskap i stand til å lisensiere arkiv av bilete, filmar og bøker for AI-trening. Denne skjulte handelen med data har gitt opphav til bekymringar om personopplysningar blir brukt i AI-modellar utan personane si vitande eller eksplisitte samtykke, noko som har ført til diskusjonar om personvern og etikk.

Det uklare AI-datamarknaden har ikkje vore omfattande studert, men estimat tyder på at han no er verdt rundt $2.5 milliardar dollar og kan vekse til nærare $30 milliardar dollar i løpet av eit tiår. Som etterspurnaden etter generative AI-modellar aukar, søkjer selskaper å sikre dataforsyningskjedene sine. Dei inngår avtalar med eigarar av innhald, som f.eks. bildebyrå som Shutterstock, for å få tilgang til dei store arkiva av bilete, videoar og musikkfiler.

I tillegg til etablerte aktørar som Shutterstock, inngår mindre teknologiselskap også liknande lisensavtalar for å sikre nødvendig data for AI-trening. Denne trenden har ført til oppkomsten av dedikerte AI-datavirksomheiter som spesialiserer seg på å skaffe innhald, enten gjennom lisensavtalar eller tilpassa produksjon med hjelp av kortvarige kontraktsarbeidarar.

Når AI-bransjen utviklar seg, blir fokuset på «etisk innhenta» innhald avgjerande. Medan selskap navigerer i komplekse datadealar, må dei også ta tak i bekymringar knytt til krenking av opphavsrett og personvern. Veksten i AI-datamarknaden gir eigarar av innhald ein moglegheit til å tjene pengar på samlingane sine, men det understrekar òg behovet for auka gjennomsikt og vern for å beskytte individuelle datarettar.

Spørsmål og svar

1. Kva er generativ AI?
Generativ AI viser til ein grein av kunstig intelligens som brukar store datasett til å lære og generere nytt innhald som svar på tekstoppgåver. Den er avhengig av å trene modellar for å forstå mønster og generere unike resultat.

2. Korleis planlegg Photobucket å bruke innhaldet sitt til generativ AI?
Photobucket er i samtalar med teknologiselskap for å lisensiere si omfattande samling av bilete og videoar. Dette innhaldet vil bli brukt til å trene generativ AI-modellar, slik at dei kan produsere nytt innhald basert på tekstoppgåver.

3. Kva er bekymringar knytt til bruk av personopplysningar i AI-modellar?
Bruken av personopplysningar i AI-modellar utan eksplisitt samtykke reiser personvernbekymringar. Det er avgjerande å sikre at personopplysningar blir innhenta og brukte på ein etisk måte, med tiltak på plass for å beskytte individuelle rettar.

4. Kva er storleiken på AI-datamarknaden?
AI-datamarknaden er framleis eit nytt område, og det er utfordrande å estimere den nøyaktige storleiken. Likevel tyder nokre forskarar på at den no er verdt rundt $2.5 milliardar dollar og kan vokse til nærare $30 milliardar dollar i løpet av eit tiår.

5. Korleis sikrar selskap dataforsyningskjedene sine for AI-trening?
Selskap inngår lisensavtalar med innhaldseigarar for å få tilgang til arkiva sine med bilete, videoar og anna relevant data. I tillegg hjelper oppkomsten av dedikerte AI-datavirksomheiter med å skaffe innhald og sikre den etiske bruken av data.

Kjelde:
– Reuters

The source of the article is from the blog mgz.com.tw

Privacy policy
Contact