En banbrytande AI-system har utvecklats av ett forskarteam vid Massachusetts Institute of Technology (MIT) under ledning av Carl Vondrick. Denna AI har förmågan att förutse nära framtida scenarier från statiska bilder.
Forskarteamet tränade AI-systemet genom att ge den två miljoner videor som visar olika sammanhang som stränder, golfbanor, tågstationer och barn på sjukhus. Dessa videor var utan etiketter och taggar, vilket innebar att AI inte hade någon tidigare kunskap om deras innehåll. Därefter presenterade de AI:n med stillbilder och gav den i uppdrag att generera korta videosekvenser som simulerar nästa händelseförlopp. Till exempel, när den visades en bild av en tågstation, kunde AI:n simulera en rörlig tågeffekt.
Att lära AI att förutse framtida händelser hjälper den att få djupare insikter i den aktuella världen. Till exempel, när människor ser någon laga mat, kan de lätt föreställa sig att personen sedan sätter sig ner för att äta. Detta system har potential att användas inom olika områden, som att hjälpa AI att känna igen när någon är på väg att falla för att utfärda varningar eller att assistera självkörande bilar att förutse och undvika farliga situationer.
För närvarande har de videor som genereras av AI låg upplösning och varar strax över en sekund, men de är bemärkelsesvärt intelligenta och kan noggrant förutsäga rörelser inom varje scen, som en tåg som rör sig rakt framåt eller ett barns ansiktsuttryck.
Vondrick och hans team arbetar outtröttligt för att förbättra systemets förmågor för att ytterligare revolutionera hur AI kan förutse och tolka världen från stillbilder.