OpenAI представя Sora: Революционен модел за превръщане на текст в видео

OpenAI, известната стартъп компания в областта на изкуствен интелект, наскоро представи Sora, иновативен модел за превръщане на текст в видео, който има потенциал да преопредели възможностите на генеративния изкуствен интелект. Докато съществуващи инструменти като Lumiere на Google са изследвали сферата на технологиите за превръщане на текст в видео, Sora се отличава с уникалния си функционалности и възможности.

Едно разграничително качество на Sora е неговата способност да тълкува дълги инструкции, включително примери с до 135 думи. OpenAI демонстрира това, като сподели примерно видео, което показва способностите на Sora да генерира разнообразни герои и сцени, започващи от обикновени хора и животни, до фантастични чудовища, градски пейзажи, спокойни градини и дори потопен Ню Йорк. Този изключителен обхват е възможен благодарение на предишната работа на OpenAI с моделите Dall-E и GPT.

Вдъхновен от Dall-E 3, Sora използва техниката за преизчертаване, която генерира изключително подробни описания за визуалните обучителни данни. В резултат на това моделът може да създава детайлни сцени с множество герои, реалистични движения и точни детайли на обектите и задните планове. Реалистичната природа на примерните видеа е наистина впечатляваща, като само крупни планове на човешки лица или плуващи морски същества предават техните синтетични произход.

Също така, Sora предлага възможността да генерира видеа от статични изображения, както и да разшири съществуващи видеа или да попълни липсващи кадри – подобно на функционалността на Lumiere. OpenAI вярва, че постиженията на Sora в разбирането и симулирането на реалния свят са значими стъпки към постигането на изкуствената обща интелигентност (AGI) – по-развита форма на ИИ, която наподобява хуманоподобната интелигентност и обхваща по-широк кръг от задачи.

Въпреки това OpenAI признава, че Sora все още има някои ограничения. Той може да се бори да изобрази точно физиката на сложни сцени и да разбере причинно-следствената връзка. Например, моделът може да пропусне укус след залюта на бисквитка. Освен това, Sora понякога се обърква между ляво и дясно.

Въпреки че OpenAI не е обявила конкретна дата за широко разпространението на Sora, компанията подчертава важността да се прилагат необходимите мерки за безопасност предварително. Това включва спазване на съществуващите стандарти за безопасност, които предотвратяват генерирането на екстремно насилие, сексуално съдържание, омразен образ, подобие на знаменитости и използването на интелектуална собственост на другите.

Предаността на OpenAI за разработване на все по-безопасни системи за изкуствен интелект над времето и ученето от реалния свят отразява признаването на потенциалните ползи и рискове, свързани с тази уникална технология. С Sora на фона, OpenAI продължава да надвишава границите в генеративния изкуствен интелект, полагайки основите за нова ера на творчески възможности.

The source of the article is from the blog krama.net