Nový model AI "Sora" posouvá hranice generování textu na video

OpenAI, známý svými vlivnými nástroji AI jako ChatGPT a Dall-E, nyní představil svou nejnovější tvorbu nazvanou Sora, model AI generovaného videa. Tento průlomový model kombinuje sílu „difúzního modelu“ a „transformeru“ k předpovídání a generování sekvencí videa na základě rozsáhlých tréninkových dat.

Na rozdíl od svých předchůdců se Sora vyznačuje schopností vytvářet různé druhy videí, od fotorealistických po animované a dokonce i excentrické, s maximální délkou šedesát sekund. Ačkoli momentálně je ještě není veřejně dostupná k testování, publikace ukázkových videí od OpenAI vyvolala značné nadšení, s mnoha lidmi, kteří netrpělivě očekávají příležitost vyzkoušet si ji na vlastní kůži.

První dojmy z schopností Sory naznačují, že překonala předchozí nástroje pro generování textu na video co do kvality a konzistence. Zatímco dřívější AI-generovaná videa často trpěla nekonzistencemi a zkresleními, Sora se těmto výzvám postavila čelem. OpenAI uvádí, že Sora dokáže vytvářet složité scény s více postavami, simulovat pohyb ve fyzickém světě a přesně zobrazit trvalost objektů. Výsledkem je vizuálně koherentní video zážitek, který udržuje iluzi bez přerušení.

Navzdory svým pozoruhodným úspěchům Sora není bez svých omezení. OpenAI uznává, že se mu může dařit špatně přesně simulovat složitou fyziku v scéně, porozumět příčinně následkovým vztahům a přesně zobrazit prostorové detaily. Důležité informace, jako konkrétní model GPT použitý k vývoji Sory, využitá tréninková data, datum vydání a cena zůstávají utajeny.

Přesto ukázky schopností generování videa Sory naznačují její potenciální dopad v různých odvětvích. Od tvorby poutavých sci-fi trailerů a instruktážních videí s vařením po produkci animovaných krátkometrážních filmů ve stylu Pixaru a obecných vzdušných snímků, Sora má potenciál revolučně ovlivnit oblasti videoprodukce, kinematografie, herního průmyslu a dokonce i tvorbu obsahu na sociálních médiích.

Zatímco se očekává vydání více informací a širší přístup k Sore, nelze popřít, že tento nejnovější model AI již posunul hranice toho, co lze dosáhnout v oblasti generování textu na video. Budoucí možnosti pro Soru a její dopad na vizuální vyprávění jsou nepochybně zajímavé a vyvolávají otázky ohledně neuvěřitelného potenciálu AI-generovaných videí v nadcházejících letech.

The source of the article is from the blog enp.gr