Noul trend al antreprenoriatului: Cum evoluează utilizarea datelor pentru generative AI

Photobucket, unul dintre primele site-uri de găzduire a imaginilor din anii 2000, se reinventează printr-o abordare inovatoare: licențierea extensivului său conținut fotografic pentru antrenarea modelelor de inteligență artificială generativă.

CEO-ul Ted Leonard a dezvăluit că Photobucket se află în prezent în discuții cu mai multe companii tech privind licențierea conținutului său vast. Modelele de generative AI depind de seturi de date ample pentru a învăța și a genera conținut nou în răspuns la stimuli de text. Acordurile discutate au variat de la 5 cenți la 1 dolar pentru fiecare fotografie și peste 1 dolar pentru fiecare video, prețurile fluctuând în funcție de cerințele cumpărătorului.

În timp ce Photobucket nu a dezvăluit identitățile potențialilor cumpărători din motive de confidențialitate comercială, aceste negocieri arată lumina asupra pieței emergente a datelor din jurul tehnologiei de generative AI. Giganții tech precum Google, Meta și OpenAI susținut de Microsoft inițial se bazau pe extragerea gratuită de date de pe internet pentru antrenarea modelelor lor de AI. Cu toate acestea, acum se află în căutarea unor alternative plătite, inclusiv licențierea conținutului blocat în spatele plăcilor de acces și a ecranelor de autentificare.

Firma de avocați Klaris Law a declarat că a consiliat proprietarii de conținuturi cu privire la acordurile de licențiere în valoare de zeci de milioane de dolari, permițând companiilor să licențieze arhive de fotografii, filme și cărți pentru antrenamentul AI. Această piață ascunsă a datelor a ridicat îngrijorări cu privire la folosirea datelor personale în modelele de AI fără știrea sau consimțământul explicit al indivizilor, generând discuții despre confidențialitatea și etica datelor.

Piața opacă a datelor AI nu a fost studiată extensiv, însă estimările sugerează că este evaluată în prezent la aproximativ 2,5 miliarde de dolari și ar putea crește la aproape 30 miliarde de dolari în decursul unei decenii. Pe măsură ce cererea pentru modelele de generative AI crește, companiile caută să-și securizeze lanțurile de aprovizionare cu date. Acestea încheie acorduri cu proprietarii de conținut, precum furnizorii de imagini de stoc precum Shutterstock, pentru a accesa arhivele lor extinse de imagini, videoclipuri și fișiere muzicale.

În plus față de jucătorii consacrați precum Shutterstock, companiile tech mai mici încheie, de asemenea, acorduri de licențiere similare pentru a-și asigura datele necesare pentru antrenamentul AI. Acest trend a dus la apariția unor companii dedicate de date AI care se specializează în obținerea de conținut, fie prin acorduri de licențiere, fie prin producție personalizată cu sprijinul lucrătorilor pe contract pe termen scurt.

Pe măsură ce industria AI evoluează, accentul pus pe conținutul „surselor etice” devine crucial. Pe măsură ce companiile navighează în acorduri de date complexe, trebuie să abordeze și îngrijorările legate de încălcările de drepturi de autor și de confidențialitate. Creșterea pieței datelor AI oferă oportunitatea proprietarilor de conținut de a-și monetiza colecțiile, dar subliniază și nevoia de transparență sporită și măsuri de protejare a drepturilor datelor individuale.

### Întrebări frecvente

1. Ce este generative AI?
Generative AI se referă la o ramură a inteligenței artificiale care utilizează seturi de date ample pentru a învăța și a genera conținut nou în răspuns la stimuli de text. Ea se bazează pe antrenarea modelelor pentru a înțelege modele și a genera rezultate unice.

2. Cum intenționează Photobucket să folosească conținutul său pentru generative AI?
Photobucket discută cu companii tech pentru a licenția colecția sa extensivă de fotografii și videoclipuri. Aceste active vor fi folosite pentru antrenarea modelelor de generative AI, permițându-le să producă conținut nou bazat pe stimuli de text.

3. Care sunt îngrijorările legate de utilizarea datelor personale în modelele de AI?
Folosirea datelor personale în modelele de AI fără acordul explicit ridică îngrijorări legate de confidențialitate. Există nevoia de a asigura că datele personale sunt obținute și utilizate în mod etic, cu măsuri adecvate pentru a proteja drepturile individuale.

4. Care este dimensiunea pieței datelor AI?
Piața datelor AI este încă un domeniu emergent, iar dimensiunea sa exactă este dificil de estimat. Cu toate acestea, unii cercetători sugerează că este evaluată în prezent la aproximativ 2,5 miliarde de dolari și ar putea crește la aproape 30 miliarde de dolari în decursul unei decenii.

5. Cum își securizează companiile lanțurile de aprovizionare cu date pentru antrenarea AI?
Companiile încheie acorduri de licențiere cu proprietarii de conținut pentru a accesa arhivele lor de imagini, videoclipuri și alte date relevante. În plus, apariția companiilor dedicate de date AI ajută la obținerea de conținut și la asigurarea utilizării etice a datelor.

### Surse
– Reuters

The source of the article is from the blog oinegro.com.br

Privacy policy
Contact