Перспективы использования искусственного интеллекта: инновационный подход "Тихий-STaR"

В увлекательном исследовании исследователи обнаружили, что предоставление системам искусственного интеллекта (ИИ) «внутреннего монолога» значительно улучшает их способность к рассуждениям. Обучая ИИ думать перед тем, как реагировать на приглашения, аналогично тому, как люди обдумывают свои следующие слова перед разговором, была разработана передовая методология под названием «Тихий-STaR». Этот инновационный подход инструктирует системы искусственного интеллекта генерировать несколько внутренних обоснований одновременно перед формулировкой ответа, тем самым позволяя ИИ предоставить наилучший возможный ответ.

В отличие от традиционных чат-ботов ИИ, таких как ChatGPT, которые не обдумывают свои ответы или не предвидят различные варианты беседы, алгоритм Quiet-STaR оснащает ИИ-агентов способностью генерировать ряд прогнозов с обоснованиями. При предоставлении ответов ИИ комбинирует и представляет наиболее подходящий ответ, который впоследствии может быть оценен участником на основе характера вопроса. Через этот процесс неверные обоснования отбрасываются, позволяя ИИ предугадывать будущие разговоры и извлекать уроки из текущего взаимодействия.

Используя открытую модель большого языка (LLM) Mistral 7B, исследователи применили алгоритм Quiet-STaR и обнаружили значительные улучшения. Обученная версия Mistral 7B с помощью Quiet-STaR достигла показателя рассуждения 47,2% по сравнению с начальным показателем перед обучением в 36,3%. Хотя она все еще испытывала трудности с школьным математическим тестом, показав 10,9%, это было значительным улучшением по сравнению с начальным показателем ванильной версии в 5,9%.

Важно отметить, что исследователи сосредоточились на решении ограничений существующих моделей ИИ в понимании здравого смысла и контекстуализации. Языковые модели, подобные ChatGPT и Gemini, основанные на нейронных сетях, которые пытаются имитировать структуру мозга человека и его образовательные шаблоны, в настоящее время не способны к подлинному пониманию. Предыдущие попытки улучшить способности к рассуждениям преимущественно были ограничены сферой применения, ограничивая их применимость к различным моделям ИИ.

Методология Quiet-STaR выделяется своей универсальностью, способностью действовать тихо на заднем плане и потенциалом для использования с различными типами LLM. Основываясь на основах алгоритма self-taught reasoner (STaR), исследователи стремятся сократить разрыв между системами ИИ на основе нейронных сетей и способностями к рассуждениям, характерными для человека. Эти многообещающие исследования открывают новые горизонты в стремлении к развитию технологий ИИ.

ЧаВО

1. Что такое Quiet-STaR?
Quiet-STaR — методология, которая обучает системы ИИ генерировать внутренние обоснования перед ответами на запросы, улучшая их способности к рассуждениям. Она включает в себя отбрасывание неверных обоснований и использование комбинации предсказаний для предоставления наилучшего ответа.

2. В чем отличие Quiet-STaR от традиционных чат-ботов ИИ?
В отличие от обычных чат-ботов ИИ, которые не размышляют и не предвидят различных возможностей в разговоре, Quiet-STaR дает возможность ИИ-агентам рассматривать различные обоснования одновременно и генерировать лучшие ответы.

3. Каковы ограничения текущих моделей ИИ?
Существующие модели ИИ испытывают проблемы с рассуждениями на основе общего здравого смысла и контекстом. Модели на основе нейронных сетей, такие как ChatGPT и Gemini, лишены подлинного понимания.

4. Как Quiet-STaR улучшает способности ИИ к рассуждениям?
Обучая системы ИИ думать перед реакцией, Quiet-STaR позволяет им предугадывать будущие разговоры, извлекать уроки из текущего взаимодействия и улучшать результаты в области рассуждений.

Источники:
— arXiv Database
— Live Science

The source of the article is from the blog newyorkpostgazette.com