Modèle innovant d’IA sous enquête pour plagiat

Une équipe d’étudiants en informatique de l’Université de Stanford a créé une vague dans l’industrie technologique avec leur modèle d’intelligence artificielle, Llama 3-V. Développé par Aksh Garg, Siddharth Sharma et Mustafa Aljadery, dont l’affiliation est floue, Llama 3-V a reçu une attention mondiale pour ses performances élevées peu de temps après sa sortie la semaine dernière, l’équipe de recherche le déclarant comme un concurrent redoutable pour les principaux modèles d’IA.

Malgré son classement parmi les cinq meilleures tendances sur la populaire plateforme d’IA Hugging Face, la célébration de Llama 3-V a été de courte durée. Des accusations ont émergé selon lesquelles le modèle était une réplique du MiniCPM-Llama3-V 2.5, créé en collaboration par le Laboratoire de Traitement du Langage de l’Université Thanh Hoa et ModelBest, une startup d’IA de Beijing.

Tant la structure que le code de Llama 3-V se sont révélés être presque identiques à son prédécesseur sur la plateforme open-source GitHub. Le cofondateur de ModelBest, Liu Zhiyuan, via WeChat, a exprimé de forts soupçons selon lesquels l’équipe de Stanford aurait reproduit leur projet.

Une caractéristique notable du MiniCPM-Llama3-V2.5 est sa capacité à reconnaître des caractères chinois anciens, un ensemble de données non publié. Des erreurs de correspondance dans la reconnaissance de caractères entre les deux modèles ont alimenté les accusations.

Dans une déclaration lundi, Garg et Sharma ont admis les similitudes frappantes avec le MiniCPM-Llama3-V 2.5 et présenté des excuses aux auteurs originaux. Ils ont également révélé qu’Aljadery était responsable du codage du projet et a pris la faute pour les défaillances dans la vérification des sources.

L’épisode a suscité beaucoup d’émoi en ligne, en particulier en Chine. Le professeur Christopher Manning du Laboratoire d’IA de Stanford a critiqué la copie comme une honte. L’incident a suscité des discussions sur les avancées de la Chine en matière d’IA, reconnues par des chercheurs comme Lucas Beyer de Google DeepMind, qui ont noté que malgré sa qualité, le MiniCPM-Llama3-V 2.5 n’avait pas attiré l’attention désirée, peut-être en raison de son origine chinoise.

Reconnaissant l’écart entre les modèles d’IA chinois et les principaux projets occidentaux, Liu Zhiyuan a souligné les progrès significatifs réalisés par le secteur de l’IA en Chine au cours de la dernière décennie. Cette controverse soulève non seulement des inquiétudes éthiques en matière de recherche scientifique, mais met également en lumière les progrès rapides de la Chine dans le paysage concurrentiel de la technologie de l’IA.

The source of the article is from the blog agogs.sk

Privacy policy
Contact