OpenAI Dévoile Sora : Un Modèle Texte-Vidéo Révolutionnaire

OpenAI, la start-up en intelligence artificielle renommée, a récemment introduit Sora, un modèle innovant texte-vidéo qui est sur le point de redéfinir les possibilités de l’IA générative. Alors que des outils existants comme Lumiere de Google ont exploré le paysage de la technologie texte-vidéo, Sora se distingue par ses fonctionnalités et capacités uniques.

Un aspect distinctif de Sora est sa capacité à interpréter des instructions longues, y compris des exemples contenant jusqu’à 135 mots. OpenAI a démontré cela en partageant une vidéo d’exemple qui mettait en avant la capacité de Sora à générer des personnages et des scènes variés, allant des gens ordinaires et des animaux à des monstres fantaisistes, des paysages urbains, des jardins sereins, et même une ville de New York submergée. Cette gamme extraordinaire est rendue possible grâce aux travaux antérieurs d’OpenAI avec les modèles Dall-E et GPT.

S’inspirant de Dall-E 3, Sora utilise une technique de recaptioning qui génère des légendes hautement descriptives pour les données d’entraînement visuelles. En conséquence, le modèle peut créer des scènes complexes avec plusieurs personnages, des mouvements réalistes, et des détails précis des sujets et des arrière-plans. La nature réaliste des vidéos d’exemple est vraiment impressionnante, seules les gros plans des visages humains ou des créatures marines nageantes trahissant leur origine synthétique.

Sora offre également la capacité de générer des vidéos à partir d’images fixes, ainsi que d’étendre des vidéos existantes ou de compléter des images manquantes, tout comme la fonctionnalité de Lumiere. OpenAI estime que les avancées de Sora dans la compréhension et la simulation du monde réel sont des jalons importants vers la réalisation de l’intelligence artificielle générale (AGI) – une forme plus avancée d’IA qui ressemble étroitement à l’intelligence humaine et englobe une gamme plus large de tâches.

Cependant, OpenAI reconnaît que Sora a encore certaines limitations. Il peut avoir du mal à dépeindre avec précision la physique des scènes complexes et à comprendre la cause et l’effet. Par exemple, le modèle peut omettre une marque de morsure sur un cookie après qu’une personne en a pris une bouchée. De plus, Sora peut parfois confondre la gauche et la droite.

Alors qu’OpenAI n’a pas annoncé de date de sortie spécifique pour une disponibilité étendue de Sora, la société met l’accent sur l’importance de mettre en œuvre les mesures de sécurité nécessaires au préalable. Cela inclut le respect des normes de sécurité existantes qui empêchent la génération de violence extrême, de contenu sexuel, d’images haineuses, de ressemblances de célébrités, et l’utilisation de la propriété intellectuelle d’autrui.

L’engagement d’OpenAI à développer des systèmes d’IA de plus en plus sûrs au fil du temps et à tirer des enseignements de l’utilisation du monde réel reflète leur reconnaissance des avantages potentiels et des risques associés à cette technologie révolutionnaire. Avec Sora à l’avant-garde, OpenAI continue de repousser les limites en matière d’IA générative, préparant le terrain pour une nouvelle ère de possibilités créatives.

The source of the article is from the blog klikeri.rs

Privacy policy
Contact