OpenAI Presenterar Sora: En Banbrytande Text-till-Video-Modell

OpenAI, den kända AI-startupen, har nyligen introducerat Sora, en innovativ text-till-video-modell som är redo att omdefiniera möjligheterna med generativ AI. Medan befintliga verktyg som Googles Lumiere har utforskat landskapet för text-till-video-teknik, sticker Sora ut med sina unika funktioner och möjligheter.

En distinkt aspekt av Sora är dess förmåga att tolka långa uppmaningar, inklusive exempel med upp till 135 ord. OpenAI demonstrerade detta genom att dela en provvideo som visade Soras kapacitet att generera olika karaktärer och scener, från vanliga människor och djur till fantastiska monster, stadsmiljöer, lugna trädgårdar och till och med ett nedsänkt New York City. Denna extraordinära räckvidd möjliggörs tack vare OpenAI:s tidigare arbete med Dall-E- och GPT-modeller.

Med inspiration från Dall-E 3 använder sig Sora av en teknik för omskrivning som genererar mycket beskrivande bildtexter för visuella träningsdata. Som ett resultat kan modellen skapa intrikata scener med flera karaktärer, livlig rörelse och exakta detaljer av ämnena och bakgrunderna. Den realistiska naturen i provvideona är verkligen imponerande, med endast närbilder av mänskliga ansikten eller simmande havsvarelser avslöjar deras syntetiska ursprung.

Sora erbjuder också möjligheten att generera videor från stillbilder samt förlänga befintliga videor eller fylla i saknade ramar – liknande Lumieres funktioner. OpenAI tror att Soras framsteg i förståelsen och simuleringen av den verkliga världen utgör betydande milstolpar mot att uppnå artificiell allmän intelligens (AGI) – en mer avancerad form av AI som starkt liknar mänsklig intelligens och omfattar ett bredare spektrum av uppgifter.

Dock erkänner OpenAI att Sora fortfarande har vissa begränsningar. Den kan ha svårt att exakt avbilda fysiken i komplexa scener och förstå orsak och verkan. Till exempel kan modellen utelämna ett bettavtryck på en kaka efter att en person tagit en tugga. Dessutom förväxlar Sora ibland vänster och höger.

Medan OpenAI inte har meddelat ett specifikt releasedatum för en bred tillgänglighet av Sora, betonar företaget vikten av att genomföra nödvändiga säkerhetsåtgärder i förväg. Detta inkluderar att följa befintliga säkerhetsstandarder som förhindrar skapandet av extrema våldsskildringar, sexuellt innehåll, hatfulla bilder, kändisliknelser och användning av andras immateriella egendom.

OpenAIs engagemang för att utveckla allt säkrare AI-system över tiden och lära sig från verklig användning speglar deras erkännande av både de potentiella fördelarna och riskerna med denna banbrytande teknologi. Med Sora i spetsen fortsätter OpenAI att utmana gränserna inom generativ AI och banar väg för en ny era av kreativa möjligheter.

The source of the article is from the blog mivalle.net.ar