OpenAI Представя Етични насоки за моделите на изкуствен интелект

OpenAI споделя чертеж за отговорна изкуствена интелигентност

OpenAI разкри пионерски чернов документ, който служи като чертеж за създаването на етични и отговорни системи за изкуствен интелект (ИИ). Този документ изброява множество фактори, които ИИ трябва да вземе предвид при отговаряне на потребителски заявки, включително благополучието на хората и спазването на правното съответствие, до уважение към създателите и техните права. OpenAI потвърждава, че всичките си ИИ модели, включително GPT, Dall-E и скорошно пуснатият Sora, ще спазват тези поведенчески принципи.

Иновативният модел Spec открива път за етичните изследвания на ИИ

В това, което OpenAI определя като Modell Spec, компанията го вижда като набор от насоки, предназначен за формиране на начина, по който изследователите и данните анотатори създават данни чрез технология, известена като Опитно учене от човешки обратна връзка (RLHF). Въпреки че тези спецификации още не са били приложени в настоящия си вид, те са базирани на документи, използвани преди в RLHF в OpenAI. Освен това, OpenAI разработва техники, които ще позволят на техните модели да учат директно от тези моделни спецификации.

Прилагане на строги правила за напреднали системи за ИИ

Сред критичните правила, които са посочени, са йерархията на команда, която гарантира, че ИИ не може да пренулира инструкциите на разработчика, спазване на съществуващите закони, уважение към създателите и техните права, както и защита на личната неприкосновеност. Специфично правило изисква ИИ да не предоставя информация, която представя химични, биологични, радиологични или ядрени (ХБРЯ) рискове.

Освен това черновата представлява набор от стандартни поведенчески кодове за всеки ИИ модел. Те включват приемането на най-добрите намерения от страна на потребителите или разработчиците, задаване на проучващи въпроси, помощ без надхвърляне, запазване на обективна гледна точка, въздържане от опити за промяна на мненията, изразяване на несигурност и други уважителни и неинтрузивни поведения.

Еволюиращи ИИ спецификации с непрекъснат вход
Забележително е, че Моделът Spec не е единствената точка на справка за OpenAI. Това трябва да бъде допълнено с политиките за употреба на компанията, които управляват начина, по който се очаква от хората да използват API и продукта им ChatGPT. OpenAI подчертава идеята, че, точно като техните модели, спецификациите са динамични и ще продължат да се развиват, под влиянието на активното участие на потребителите и обратната връзка на заинтересованите страни.

Ключови въпроси и отговори:

1. Какви са основните цели на Model Spec на OpenAI?
Основните цели са да гарантират, че ИИ системите се държат етично, спазват правните стандарти, уважават създателите и техните права, и защитават личната неприкосновеност, сред другите отговорни поведенчески аспекти.

2. Как ще прилага OpenAI тези насоки?
OpenAI планира да разработи техники, които позволяват на своите ИИ модели, като GPT и Dall-E, да учат директно от Model Spec чрез Опитно учене от човешки обратна връзка (RLHF).

3. Има ли специфични правила за поведението на ИИ, които OpenAI е подчертал?
Да, правилата включват спазване на йерархия на команда, съответствие със законите, уважение към създателите и техните права, защита на личната неприкосновеност и избягване на разпространението на информация, която би могла да доведе до ХБРЯ рискове.

4. Ще остане ли Model Spec статичен или ще се променя ли с времето?
Model Spec е динамичен и ще се развива, влиян от обратната връзка на потребителите и заинтересованите страни, както и от непрекъснатото участие.

Предизвикателства и Контроверзии:

– Изпълнение: Гарантирането на редовното спазване на етичните насоки от страна на ИИ системите и определянето на действията, които да се предприемат при отклонения.

– Динамична природа: Непрекъснато обновяване на етичните насоки за ИИ моделите в отговор на новите предизвикателства, технологиите и обществените норми.

– Пристрастие и Дискриминация: Справяне с проблема на вграденото пристрастие в ИИ системите и гарантиране, че етичните насоки са достатъчно здрави, за да предотвратят дискриминационни практики.

Предимства:

– Увеличено Доверие: Етичните насоки приносят за увеличаване на доверието от страна на публиката и правителствата в технологиите на ИИ.

– Повишена Безопасност: Такива насоки се насочват към намаляване на рисковете, свързани с напредналите системи за ИИ и предотвратяване на злоупотреба.

– Социално и Правно Съответствие: Гарантиране, че ИИ системите спазват съществуващите закони и уважават правата и личната неприкосновеност на лицата.

Недостатъци:

– Потенциално Заглушаване на Иновации: Строгите правила могат да забавят изследванията и иновациите в областта на ИИ.

– Ограничения на Възможностите на ИИ: Етичните ограничения могат да ограничат пълните възможности на ИИ системите за решаване на сложни проблеми.

За допълнителна информация относно етиката на ИИ и разработката на отговорна ИИ, може би ще откриете тези домейни подходящи:
– OpenAI
– AIEthicsLab
– Partnership on AI
– AI Now Institute