Jauni pieejas veidi cilvēka atsauksmēs balstītajā pastiprinātajā mācīšanā
Pētnieki no Fudanas NLP laboratorijas, Fudanas redzes un mācīšanās laboratorijas un Hikvision Inc. ir izstrādājuši jaunākas metodes, kas uzlabo pastiprināto mācīšanos cilvēka atsauksmju pamatā (PBMA). Ieviešot jaunus paņēmienus, lai risinātu nepareizas un nenoteiktas preferences datu kopās, šie pētnieki ir iezīmējuši ceļu tam,