Сучасна система штучного інтелекту, розроблена командою дослідників Массачусетського технологічного інституту (MIT) під керівництвом Карла Вондріка, має можливість передбачати найближчі сценарії за статичними зображеннями. Команда дослідників навчила цю систему, надавши їй два мільйони відео, на яких зображені різні контексти, такі як пляжі, поля для гри в гольф, залізничні вокзали та діти в лікарнях. Важливо відзначити, що ці відео були непозначені та неекспліковані, що означає, що штучний інтелект не мав попередніх знань про їх зміст. Надалі вони подали системі неподвійні зображення та поклали на неї завдання створити короткі відеоряди, що імітують наступну послідовність подій. Наприклад, коли показувалося зображення залізничного вокзалу, штучний інтелект міг імітувати рух потягу.
Навчання штучного інтелекту передбачати майбутні події допомагає йому краще розуміти сучасний світ. Наприклад, коли люди бачать, що хтось готує їжу, вони легко можуть уявити, що ця людина далі сяде поїсти. Ця система має потенціал застосування в різних галузях, наприклад, допомагає штучному інтелекту розпізнавати, коли хтось збирається впасти, щоб видали попередження, або допомагає автомобілям з автопілотом передбачати та уникати небезпечних ситуацій.
В даний момент відео, створені штучним інтелектом, мають низьку роздільну здатність і тривають трохи більше секунди, однак вони надзвичайно інтелігентні і можуть точно передбачати рухи в межах кожної сцени, як наприклад, прямий рух потягу чи вирази обличчя дитини.
Вондрік та його команда працюють неутомно над покращенням здатностей системи для подальшої революції у способах передбачення та інтерпретації штучним інтелектом світу за допомогою статичних зображень.