MIT изследователи разработват ИИ метод за интерпретиране на невронни мрежи

MIT изследователите направиха значителен напредък в решаването на предизвикателството да се интерпретират сложни невронни мрежи в изкуствен интелект. Традиционно, обясняването на поведението на невронни мрежи изисква значително участие от хора, което ограничава мащабируемостта. Въпреки това, впечатляващ нов метод, разработен от изследователите от Компютърния център на MIT и Лабораторията за изкуствен интелект (CSAIL), използва автоматизирани агенти за интерпретация (AIAs), за да експериментират и обяснят поведението на невронните мрежи автономно.

За разлика от традиционните подходи, които се базират на експерименти и намеса от хора, методът AIA използва мощта на ИИ моделите като интерпретатори. AIAs са създадени да участват активно в формирането на хипотези, експерименталното тестване и итеративното обучение, като по същество имитират когнитивните процеси на учен. Този подход позволява за изчерпателно разбиране на сложни невронни мрежи, като например GPT-4. За да се оцени точността и качеството на обясненията, изследователите са въвели „функционална интерпретация и описание“ (FIND) референтен стандарт.

Методът AIA включва планиране и провеждане на тестове върху изчислителни системи, включително отделни неврони и цели модели. Агентите за интерпретиране генерират обяснения в различни формати, включително езикови описания и изпълним код. Този активен участник в процеса на интерпретация отличава AIA от подходите за пасивна класификация и осигурява непрекъснато подобряване на разбирането.

Референтният стандарт FIND се състои от функции, които симулират изчисленията, извършвани в обучените мрежи, и подробни обяснения на техните операции. Той обхваща различни области, включително математическо мислене и символни манипулации върху низове. Чрез включването на реални сложности в основни функции, референтният стандарт предоставя реална оценка на техниките за интерпретация.

Въпреки че методът AIA е показал превъзходна производителност спрямо съществуващите подходи, все още съществуват ограничения при описанието на определени функции в референтния стандарт. Особено в функционални поддомейни, характеризирани с шум или неправилно поведение, AIAs може да се сблъскат с трудности. Изследователите разглеждат стратегии за насочване на изследването на AIAs чрез конкретни и съответстващи входни данни. Освен това, комбинирането на иновативни методи на AIA с прекалкулирани примери може да подобри точността на интерпретацията.

Заключително, изследователите от MIT са разработили впечатляващ ИИ метод, който автоматизира разбирането и обясняването на невронни мрежи. Чрез използването на ИИ модели като интерпретатори, те са постигнали забележителни резултати в създаването и тестването на хипотези независимо. Въпреки това, все още има място за подобрения, и продължаващите усилия за изграждане на стратегии за изследване се стремят да подобрят разбираемостта и надеждността на ИИ системите.

The source of the article is from the blog klikeri.rs