OpenAI представя указания за етичен модел на изкуствен интелект

OpenAI споделя чертеж за отговорно изкуствено интелигентност

OpenAI разкри пионерски чернов документ, който служи като чертеж за създаване на етични и отговорни системи за изкуствен интелект (ИИ). Този документ описва множество фактори, които ИИ трябва да вземе под внимание при отговор на потребителски заявки, вариращи от ползите за човечеството и спазването на правното съответствие до уважаването на създателите и техните права. OpenAI потвърждава, че всички негови модели на ИИ, включително GPT, Dall-E и скоро ще бъде разкрит Sora, ще спазват тези поведенчески принципи.

Иновативният Model Spec откроява път за етични изследвания в областта на ИИ

В това, което OpenAI определя като Model Spec, компанията го вижда като набор от указания, предназначени да определят как разработчиците на данните и анотаторите трябва да създават данни чрез технология, известна като Учене от човешки отклик въз основа на Отмъщение (RLHF). Въпреки че тези спецификации още не са били приложени в настоящата им форма, те са изградени на основните документи, които преди това са били използвани в RLHF в OpenAI. Освен това, OpenAI разработва техники, които ще позволят на техните модели да учат директно от тези спецификации на моделите.

Прилагане на строги правила за напредничавите системи за ИИ

Сред важните правила, подробно описани, са йерархията на командите, която гарантира, че ИИ не може да отмени указанията на разработчика, спазването на съществуващите закони, уважението към създателите и техните права, както и защитата на личната неприкосновеност. Конкретно правило налага на ИИ да не предоставя информация, която поставя химически, биологичен, радиологичен или ядрен (CBRN) риск.

Освен това черновата установява набор от основни поведенчески кодове за всяко модел на ИИ. Те включват приемането на най-добрите намерения от страна на потребителите или разработчиците, задаване на разясняващи въпроси, помощ без допир до предела, запазване на обективни гледни точки, въздържане от опити да променят мнения, изразяване на несигурност и други уважителни и непреследващи цели поведенчески модели.

ИИ спецификации, които се развиват с непрекъснат вход

Важно е да се посочи, че Model Spec не е единствената референтна точка за OpenAI. Той ще бъде допълнен от политиките за използване на компанията, които управляват начина, по който хората трябва да използват API и техният продукт ChatGPT. OpenAI подчертава, че също както техните модели, спецификациите са динамични и ще се развиват непрекъснато, под въздействие на активното ангажиране с потребителите и обратната връзка на заинтересованите страни.

Важни въпроси и отговори:

1. Какво са основните цели на Model Spec на OpenAI?
Основните цели са да осигурят, че системите на ИИ се държат етично, спазват правните стандарти, уважават създателите и техните права и защитават личната неприкосновеност, сред други отговорни поведенчески аспекти.

2. Как ще наложи OpenAI тези насоки?
OpenAI планира да разработи техники, които позволяват на моделите му на ИИ, като GPT и Dall-E, да учат директно от Model Spec чрез Учене от човешки отклик въз основа на Отмъщение (RLHF).

3. Има ли конкретни правила за поведението на ИИ, които OpenAI е подчертала?
Да, правилата включват спазване на йерархия на команди, съответствие със законодателството, уважение към създатели и права, защита на личната неприкосновеност и избягване на разпространението на информация, която може да предизвика CBRN рискове.

4. Ще остане ли Model Spec статичен или ще се променя с времето?
Model Spec е динамичен и ще се развива, влиян от обратната връзка на потребителите и заинтересованите страни, както и от продължителното ангажиране.

Предизвикателства и Контроверзии:

– Налагане: Осигуряване на последователното спазване на етичните насоки от ИИ системите и определяне на действия, които трябва да се предприемат при отклонения.

– Динамичен характер: Непрекъснато актуализиране на етичните насоки на моделите за Етичен ИИ в отговор на новите предизвикателства, технологии и обществени норми.

– Предразсъдъци и Дискриминация: Решаване на проблема с вътрешен предразсъдък в системите за ИИ и уверяване, че етичните насоки са достатъчно здрави, за да предотвратят дискриминационни практики.

Предимства:

– Повишено Доверие: Етичните насоки допринасят за увеличаване на доверието от страна на обществото и правителствата в технологиите на ИИ.

– Подобрена Безопасност: Такива насоки се стремят да смекчат рисковете, свързани с напреднати системи за ИИ и да предотвратят злоупотребата им.

– Социално и Легално Съответствие: Осигуряване на съответствие на ИИ системите със съществуващите закони и уважението към правата и личното пространство на индивидите.

Недостатъци:

– Потенциално Страдащо На Иновациите: Стриктните правила биха могли да забавят изследователската и иновативна работа в областта на ИИ.

– Ограничения на Възможностите на ИИ: Етичните ограничения биха могли да ограничат пълните възможности на системите за ИИ за решаване на сложни проблеми.

За повече информация относно етиката на ИИ и развитието на отговорни ИИ системи, може да намерите тези домейни релевантни:
– OpenAI
– AIEthicsLab
– Partnership on AI
– AI Now Institute