L’Evolvere dell’Intelligenza Artificiale: Le Frontiere Superate dalle Aziende Tecnologiche

Nella corsa per guidare il mondo dell’intelligenza artificiale (A.I.), aziende tecnologiche come OpenAI, Google e Meta stanno affrontando sfide nell’acquisizione dei dati digitali necessari per far avanzare la propria tecnologia. Questo articolo getta luce sulle strategie a cui queste aziende stanno ricorrendo, le potenziali violazioni di regole e leggi e la crescente sete di dati nell’industria dell’A.I.

OpenAI, nota per i suoi potenti modelli di intelligenza artificiale, si è trovata di fronte a un problema di approvvigionamento alla fine del 2021 quando ha esausto tutte le fonti affidabili di testo in lingua inglese su internet per addestrare il suo sistema A.I. Per superare questo ostacolo, i ricercatori di OpenAI hanno sviluppato uno strumento di riconoscimento vocale chiamato Whisper. Lo scopo di questo strumento era trascrivere l’audio dai video di YouTube, fornendo così nuovo testo conversazionale in grado di potenziare le capacità del loro sistema A.I.

Tuttavia, sono sorti dubbi all’interno di OpenAI riguardo alla potenziale violazione delle regole di YouTube nell’utilizzo dei loro video per questa applicazione “indipendente”. Nonostante i dubbi, un team di OpenAI, guidato da Greg Brockman, il presidente di OpenAI, ha proceduto a trascrivere oltre un milione di ore di video di YouTube. I testi risultanti sono stati poi utilizzati per addestrare GPT-4, uno dei modelli A.I. più potenti al mondo e alla base dell’ultima versione del chatbot ChatGPT.

Analogamente, presso Meta (ex Facebook), i dirigenti, gli avvocati e gli ingegneri della società hanno contemplato l’acquisizione della casa editrice Simon & Schuster. Ottenendo accesso a opere scritte lunghe, Meta mirava a garantirsi una preziosa fonte di dati. Inoltre, l’azienda ha discusso dell’estrazione di dati protetti da copyright da varie fonti su internet. In alcuni casi, erano disposti ad affrontare potenziali battaglie legali piuttosto che negoziare licenze con editori e creatori di contenuti.

Lo sviluppo dei modelli A.I. ha subito una significativa trasformazione negli ultimi anni. Prima del 2020, modelli come GPT-2 si basavano su quantità relativamente limitate di dati di addestramento. Tuttavia, con il rilascio di GPT-3, i ricercatori hanno iniziato a includere dataset molto più ampi, riconoscendo l’importanza del volume dei dati nell’addestramento efficace dei modelli.

Mentre l’industria dell’A.I. continua a spingere i confini, l’acquisizione di vaste quantità di dati è diventata fondamentale per nuovi avanzamenti. Aziende come OpenAI e Meta sono disposte a spingersi oltre, potenzialmente piegando le regole e correndo rischi legali per soddisfare i loro requisiti di dati. Il dibattito sui aspetti etici e legali dell’acquisizione di dati nell’industria dell’A.I. è destinato a continuare con il progredire della tecnologia.

Per approfondire questo argomento, è possibile fare riferimento alle seguenti fonti:
– The New York Times: www.nytimes.com
– Epoch: www.epoch.com

FAQ:

Q: Cos’è l’A.I.?
A: L’A.I. sta per Intelligenza Artificiale, che si riferisce allo sviluppo di sistemi informatici capaci di svolgere compiti che normalmente richiedono intelligenza umana.

Q: Cos’è GPT-4?
A: GPT-4 è uno dei modelli A.I. più potenti sviluppati da OpenAI. Sta per Generative Pre-trained Transformer 4 ed è utilizzato per generare testo simile a quello umano basandosi su prompt dati.

Q: Cosa sono ChatGPT e Whisper?
A: ChatGPT è un chatbot sviluppato da OpenAI, alimentato da modelli GPT. Whisper è uno strumento di riconoscimento vocale creato da OpenAI per trascrivere l’audio dai video di YouTube.

The source of the article is from the blog myshopsguide.com

Privacy policy
Contact