OpenAI Представляє Проривний Штучний Інтелект, Здатний Симулювати Фізичний Світ

OpenAI недавно представив свій проривний модель штучного інтелекту для перетворення тексту в фотореалістичне відео під назвою Sora, що є значним кроком уперед у технології генеративного штучного інтелекту. Це важливе досягнення має потенціал революціонізувати різні галузі поза виробництвом відео.

Sora отримав прізвисько “симулятор світу” від OpenAI, оскільки він демонструє розуміння важливих аспектів тривимірного світу. Штучний інтелект може генерувати сцени, схожі на комп’ютерну графіку цифрових пейзажів або створювати відео, які захоплюють сутність сценаріїв реального світу, наприклад, жінку, яка йде по вулиці, освітленій неоновим світлом вночі.

Дослідник, що стоїть за Sora, Тім Брукс, пояснює, що здатність штучного інтелекту розуміти 3D геометрію та послідовність виникла природним чином внаслідок постійного впливу великого обсягу даних, а не була програмована наперед. Це відкриття підкреслює великий потенціал масштабування моделей створення відео у побудові універсальних симуляторів фізичного світу.

Для тренування Sora OpenAI подав на вхід великі обсяги відео з підписами, встановлюючи зв’язок між відеозйомкою та текстовим введенням. Цей підхід дозволяє штучному інтелекту генерувати нові відео на основі вказівок, продовжувати існуючі кліпи або перетворювати зображення, створені штучним інтелектом, у відеоформат.

Неодмінною рисою, спостереженою в дослідників OpenAI під час розвитку Sora, є здатність штучного інтелекту симулювати аспекти людей, тварин та середовищ, які є характерними для фізичного світу. Це стає очевидним у згенерованих кліпах, де представлені динамічні зміни камери та дивовижно плавні рухи, що свідчать про значне розуміння тривимірних просторів.

Потенційні застосування Sora виходять за межі виробництва відео, OpenAI навіть зазначає його потенціал для геймінгових платформ. За допомогою подальшого масштабування моделей відеозйомки можна розробити високо здатні симулятори як фізичних, так і цифрових реальностей, разом із їх мешканцями.

Важливо зауважити, що у Sora все ще існують певні обмеження. Модель не повністю розуміє причинно-наслідкові зв’язки, що демонструється випадками, коли людина бере кусок печива, але печиво залишається цілим або скляна кружка протікає без тріскання. Незважаючи на ці недоліки, Sora дає уявлення про майбутнє, де відео, створене штучним інтелектом, нерозрізнимо від реальності.

OpenAI забезпечує зусилля з усунення можливих ризиків, пов’язаних з цією технологією. Компанія планує поступове впровадження Sora для оцінки можливих шкідливих наслідків та ризиків за допомогою зовнішніх експертів. Забезпечення безпеки є відомою першочерговою задачею, оскільки OpenAI визнає потенціал зловживання.

В підсумку, Sora від OpenAI представляє собою величезний прорив у технології штучного інтелекту. Його здатність симулювати фізичний світ та генерувати фотореалістичне відео показує величезний потенціал генеративних моделей штучного інтелекту. Хоча є ще завдання, які потрібно вирішити, Sora відкриває шлях до майбутнього, де створений штучним інтелектом контент змушує розмити межу між реальністю та штучністю.

The source of the article is from the blog scimag.news