UCLA teadlased on välja töötanud läbimurdelise meetodi nõrkade suurte keelemudelite (LLM) jõudluse parandamiseks, ilma vajaduseta täiendava inimese tagasiside järele. See uudne häälestamismeetod, mida nimetatakse eneseõppe häälestamiseks (SPIN), võimaldab LLM-idel kaasata end omaenda vastustega eneseõppesse, parandades nii nende loomuliku keele mõistmist.
Varasemad lähenemisviisid sellele probleemile hõlmasid sünteetiliste andmete kasutamist binäärsel tagasisidel või nõrgemate mudelite kasutamist tugevamate juhendamiseks.… Read the rest