IŠŠŪKIAI, SU KURIAIS SUSIDURIA AI MODELIAI PATSAPTIEJI DARANTI SAVO TURINĮ

Pažangusis tyrimas, atliktas Pietų Mičigano universiteto, nagrinėja iššūkius, su kuriais susiduria dirbtinio intelekto (AI) modeliai savidetektyvų problemų atveju. Tyrime nagrinėjama kiekvieno AI modelio mokymo duomenų unikalumas ir sukuriamų artefaktų transformatorinės technologijos pagalba. Mokslininkai nustatė, kad nors kai kurie AI modeliai, pvz., Bardas ir ChatGPT, sėkmingai galėjo atpažinti savo turinį, kiti, pvz., Claude, sunkiai sugebėjo aptikti savo sukurtą turinį. Ši neatitikties savidetekcijoje priežastis gali būti paaiškinama aptinkamų artefaktų, esančių Barde ir ChatGPT turinyje, buvimu, o Claude rezultatai parodė mažiau aptinkamų artefaktų.

Mokslininkai pradiniame etape siekė sukurti pačiosaptikimo metodą, vadinamą „self-detection”, kur AI modelis naudotų savo artefaktus, skirtus atskirti savo sukuriamą tekstą nuo žmogaus parašyto teksto. Šis metodas panaikina poreikį kurti detektorinius įrankius visiems generuojantiems AI modeliams, teikiant svarbią pranašumą nuolat kintančiame naujų modelių pasaulyje.

Norėdami patikrinti savo hipotezę, mokslininkai atliko eksperimentą, kuriame dalyvavo trys AI modeliai: OpenAI sukurta ChatGPT-3.5, Google sukurta Barda ir Anthropic sukurta Claude. Kiekvienas modelis, naudojant tuos pačius pradinius uždavinius, sukūrė esė apie penkiasdešimt skirtingų temų. Taip pat AI modeliams buvo reikalaujama parašyti savo turinį kitaip, kad būtų galima stebėti tekstą patysaptikimą.

Rezultatai parodė, kad Bardas ir ChatGPT, apskritai buvo sėkmingi savo turinio atpažinime. Tačiau „ZeroGPT” AI aptikimo įrankis turėjo skirtingą tikslumo lygį, aptikiant turinį, sukurtą skirtingais modeliais. Dėkingumas, „ZeroGPT” turėjo sunkumų aptikti Claude’o sukurtą turinį, kuris taip pat negalėjo sėkmingai atpažinti savo turinio. Mažesnio aptinkamų artefaktų kiekio Claude’o sukurtas turinys paaiškina, kodėl tiek Claude, tiek „ZeroGPT” turėjo ribotą sėkmę atpažįstant Claude’o esė.

Įdomu tai, kad tyrimas taip pat atskleidė, jog Bardas atrodo generuoja daugiau aptinkamų artefaktų, todėl jį lengviau aptikti, tuo tarpu Claude’o sukurti artefaktai yra žymiai mažesni. Šie rezultatai rodo, kad turinio savidetekcijos gebėjimai yra įtakojami kiekvieno AI modelio sukurtų artefaktų buvimo ir aptinkamumo.

Išvadose šis tyrimas paaiškina AI modelių iššūkius, su kuriais jie susiduria savidetekdami savo sukurta turini. Suprasti kiekvieno AI modelio artefaktų unikalumą gali suteikti vertingų žinių, siekiant pagerinti turinio aptikimo būdus ir skatinti būsimų tikslinių aptikimo įrankių plėtrą.

The source of the article is from the blog karacasanime.com.ve