OpenAI представляет руководящие принципы этичной модели искусственного интеллекта

OpenAI дает план ответственного искусственного интеллекта

OpenAI представила революционный черновой документ, который служит планом создания этичных и ответственных систем искусственного интеллекта (ИИ). В этом документе описано множество факторов, которые ИИ должен учитывать при реагировании на запросы пользователей, начиная от пользы для человечества и соблюдения юридических норм до уважения к создателям и их правам. OpenAI подтвердила, что все ее модели ИИ, включая GPT, Dall-E и скоро выходящую модель Sora, будут следовать этим поведенческим принципам.

Инновационная модель Spec выстраивает путь для исследования этичного искусственного интеллекта

Компания называет Model Spec руководством, которое призвано направлять исследователей и аннотаторов данных в процессе создания данных с использованием технологии Reinforcement Learning from Human Feedback (RLHF). Хотя эти спецификации еще не были применены в их нынешней форме, они фундаментально основаны на документах, использованных ранее в RLHF в OpenAI. Кроме того, OpenAI разрабатывает техники, которые позволят их моделям учиться напрямую на основе этих спецификаций модели.

Введение строгих правил для продвинутых систем искусственного интеллекта

Среди ключевых правил подробно описана иерархия команд, которая гарантирует, что ИИ не может отменить инструкции разработчика, соответствие существующим законам, уважение к создателям и их правам, а также защита частной жизни. Особое правило предписывает ИИ не предоставлять информацию, которая представляет химическую, биологическую, радиологическую или ядерную (ХБРЯ) опасность.

Более того, проект содержит набор кодов поведения по умолчанию для любой модели ИИ. Среди них предположение о лучших намерениях пользователей или разработчиков, задание уточняющих вопросов, помощь без лишнего вмешательства, сохранение объективной точки зрения, воздержание от попыток изменить мнения, выражение неуверенности и другие уважительные и не навязчивые поведенческие черты.

Эволюция спецификаций ИИ с непрерывной обратной связью

Важно отметить, что Model Spec не единственная опорная точка для OpenAI. Ее намерено дополнить политика использования компании, которая регламентирует ожидаемое поведение людей при использовании API и продукта ChatGPT. OpenAI подчеркивает, что, так же как и их модели, спецификации динамичны и будут непрерывно совершенствоваться под влиянием активного взаимодействия с пользователями и обратной связи заинтересованных сторон.

Основные вопросы и ответы:

1. Каковы основные цели Model Spec OpenAI?
Основные цели заключаются в обеспечении этичного поведения ИИ, соблюдении юридических норм, уважении к создателям и их правам, а также защите индивидуальной конфиденциальности, среди других ответственных поведенческих аспектов.

2. Как OpenAI будет обеспечивать соблюдение этих правил?
OpenAI планирует разработать техники, которые позволят ее моделям ИИ, таким как GPT и Dall-E, учиться непосредственно из Model Spec с использованием Reinforcement Learning from Human Feedback (RLHF).

3. Есть ли у OpenAI какие-либо специфические правила поведения для ИИ, на которые она обращает внимание?
Да, правила включают соблюдение иерархии команд, соблюдение законов, уважение к создателям и их правам, защиту конфиденциальности и предотвращение распространения информации, которая могла бы повлечь за собой опасность ХБРЯ.

4. Останется ли Model Spec статичным или изменится со временем?
Model Spec динамичен и будет развиваться, под воздействием обратной связи пользователей и заинтересованных сторон, а также продолжающегося взаимодействия.

Проблемы и споры:

— Соблюдение: Обеспечение последовательного соблюдения ИИ этических правил и определение действий при отклонении от них.

— Динамичная природа: Постоянное обновление этических руководств модели ИИ в ответ на новые вызовы, технологии и социальные нормы.

— Предвзятость и дискриминация: Работа над проблемой врожденной предвзятости в системах ИИ и обеспечение того, чтобы этические руководства были достаточно надежны для предотвращения дискриминационных практик.

Преимущества:

— Повышение доверия: Этические руководства способствуют увеличению доверия общественности и правительств к технологиям ИИ.

— Повышение безопасности: Такие руководства направлены на снижение рисков, связанных с продвинутыми технологиями ИИ, и предотвращение их злоупотребления.

— Социальное и юридическое соблюдение: Обеспечение соблюдения системами ИИ существующего законодательства и уважения прав и конфиденциальности индивидуумов.

Недостатки:

— Потенциальное подавление инноваций: Строгие правила могут замедлить исследования и инновации в области ИИ.

— Ограничения на возможности ИИ: Этические ограничения могут ограничить полные возможности систем ИИ для решения сложных проблем.

Для дополнительной информации о нравственных вопросах ИИ и ответственной разработке ИИ вам могут быть интересны следующие области:
— OpenAI
— AIEthicsLab
— Partnership on AI
— AI Now Institute