Flitto și Upstage formează o alianță pentru îmbunătățirea inteligenței artificiale în limbaje prin colectarea de date în mai multe limbi

Crearea modelelor de limbaj colosale pentru piața asiatică

Flitto, o companie de date de limbaj AI, a anunțat colaborarea sa cu firma de tehnologie AI Upstage pentru îmbunătățirea modelelor de limbaj mari (LLM). Principalul lor obiectiv va fi îmbunătățirea performanței LLM prin colectarea unor limbi cu resurse reduse precum thai, japoneză, vietnameză, lao și khmer, prevalente în regiunile asiatice.

Obiectivele colaborării

Parteneriatul strategic va include dezvoltarea unui clasament coreean pentru LLM denumit ‘Ko-LLM’, gestionarea clasamentelor multilingve pentru LLM-uri și valorificarea limbilor cu resurse reduse pentru localizarea LLM-urilor. Ambele părți își propun să îmbunătățească sofisticarea modelului de limbaj AI și să răspundă cererii corporative pentru seturi de date ale modelelor de limbaj mai mici (sLLM).

Îmbunătățirea acurateței modelului de limbaj

Valorificând expertiza sa în crearea de corpuri paralele multilingve și seturi de date bogate fără probleme de drepturi de autor, Flitto își propune să-și crească competiția tehnologică în colectarea de limbaje. Între timp, Upstage caută să obțină date de înaltă calitate pentru limbile cu resurse reduse pentru a-și extinde LLM-ul pre-antrenat numit ‘Sola’. Se așteaptă ca Sola să susțină o gamă mai largă de limbi, inclusiv japoneză și thai până la sfârșit de an, având deja suport pentru coreeană și engleză.

Impactul anticipat asupra ecosistemului AI

Reprezentanții ambelor companii au exprimat importanța strategică a acestei colaborări. CEO-ul Flitto a subliniat importanța învățării limbilor cu resurse reduse ca o cheie pentru îmbunătățirea performanței LLM, în timp ce conducerea Upstage a subliniat necesitatea datelor de calitate pentru inovația globală în AI. Alianța este văzută ca un pas promițător spre contribuirea pozitivă la ecosistemul AI intern și îmbunătățirea experienței globale a AI-ului generativ.

Întrebări cheie și răspunsuri:

Ce sunt limbile cu resurse reduse și de ce sunt importante pentru LLM-uri?
Limbile cu resurse reduse sunt limbile pentru care există o cantitate relativ mică de text digital disponibil pentru antrenarea modelelor de învățare automată. Aceste limbi sunt importante pentru LLM-uri deoarece includerea lor poate îmbunătăți capacitatea modelelor de a înțelege și genera text într-o varietate mai largă de limbi, făcând aplicațiile AI mai incluzive și relevante pentru mai multe persoane.

Care sunt unele provocări cheie asociate cu colectarea datelor pentru limbile cu resurse reduse?
Una dintre provocările cheie este lipsa seturilor de date existente, ceea ce face necesară crearea de resurse noi de la zero. Acest lucru implică adesea inițiative consumatoare de timp și costisitoare precum obținerea vorbitorilor nativi, asigurarea calității traducerilor și colectarea unui corpus de text suficient de diversificat și mare.

Ce controverse ar putea apărea din această colaborare?
Aspecte precum preocupările legate de confidențialitate, utilizarea etică a datelor și posibilele judecăți de valoare în modelele AI ar putea fi controverse asociate oricăror eforturi de colectare de date la scară largă și dezvoltare AI.

Avantaje și dezavantaje:

Avantaje:
– Îmbunătățirea includerii în aplicațiile AI prin susținerea unei game mai largi de limbi.
– Experiență îmbunătățită pentru vorbitorii de limbi cu resurse reduse prin interacțiuni mai precise și naturale cu sistemele AI.
– Beneficii economice potențiale prin stimularea ecosistemului AI intern și deschiderea unor piețe noi în Asia pentru servicii AI.

Dezavantaje:
– Riscul potențial al calității insuficiente a datelor sau seturilor de date părtinitoare din cauza provocărilor de colectare a datelor în limbile cu resurse reduse.
– Preocupări etice legate de colectarea, stocarea și utilizarea datelor, în special în regiunile cu opinii divergente despre confidențialitatea și protecția datelor.
– Modelele de limbaj AI ar putea să nu atingă paritatea în performanță pentru toate limbile, ducând la experiențe inegale ale utilizatorilor.

Conform solicitării, iată un link sugerat relaționat, asigurându-ți validitatea până la ultima actualizare a informațiilor:
Flitto
Upstage

Concluzie:
Parteneriatul dintre Flitto și Upstage marchează un pas semnificativ în abordarea nevoii de LLM-uri care pot susține o varietate de limbi, în special cele subreprezentate. Lucrând împreună, ei speră să reducă diviziunea lingvistică în tehnologia AI și să promoveze o reprezentare lingvistică mai diversă care să beneficieze utilizatorii globali. Cu toate că există provocări, avantajele potențiale ale modelelor de limbaj AI mai sofisticate și mai incluzive prezintă un viitor captivant pentru inovația globală în domeniul AI.

The source of the article is from the blog radardovalemg.com

Privacy policy
Contact