OpenAI Sora: Korkutucu Derecede Gerçekçi AI Video Oluşturucu

OpenAI son zamanlarda devrim niteliğinde bir AI video oluşturucusu olan Sora’yı tanıttı. Önceki AI programlarının aksine, metin tabanlı yanıtlar veya görüntüler oluşturmaya odaklanan Sora, tam, son derece gerçekçi videolar üretme yeteneğine sahip. Sora’nın ulaştığı detay ve kalite seviyesi o kadar etkileyici ki, AI tarafından üretilen videoları gerçek çekimlerden ayırt etmek zor olabiliyor.

Sora’nın animasyon yetenekleri zaten oldukça dikkat çekici. Sevimli yaratıklardan canlı dans dizilerine kadar çeşitli animasyon içerikleri oluşturabiliyor. Oluşturulan animasyonlar, Pixar veya DreamWorks gibi tanınmış animasyon stüdyolarının kalitesine uyuşmayabilir, ancak hala genellikle insanların dahil olduğunu düşündüren profesyonel bir görünüme sahiptir.

Ancak, seyircileri gerçekten etkileyen ve korkutan şey Sora’nın gerçekçi videolarıdır. OpenAI, tarihi bir kilise, neşeli bir geçit töreni ve Tokyo’da karla kaplı bir sokak gibi videolar sergiledi, hepsi de şüphesiz gerçekçi görünüyordu. Var olabilecek ufak kusurlar olsa bile, örneğin varlıkların eğrilmesi veya kayması gibi, bu kusurlar kolayca video sıkıştırma gibi yanıltıcı olabilir. Örneğin, karla oynayan yavru köpeklerin olduğu bir video o kadar gerçekçi görünüyor ki, aslında simüle edilmiş bir gerçekliğde mi yaşıyoruz sorusunu akla getiriyor.

Peki, Sora sihrini nasıl yapar? Tüm teknik detaylar açıklanmamış olsa da, OpenAI, Sora’nın bir yayılma modeli olduğunu açıklıyor. Rastgele gürültü ile başlar ve bu gürültüyü istenilen görüntüye, bu durumda bir videoya benzer hale gelene kadar kademeli olarak azaltır. Sora, sıkıştırılmış görüntüler ve düşük-boyutlu bir latent alanına dönüştürülen videolar üzerinde eğitilir. Bu latent temsiller daha sonra model içinde videolar oluşturmak için kullanılır ve nihai çıktıya pixel uzayında geri çözülerek sonuç elde edilir.

Sora’nın ilginç bir özelliği, hareketsiz görüntülerden videolar oluşturma yeteneğidir. Ayrıca mevcut videoları her iki yönde de genişletebilir, böylece kusursuz döngüler oluşturabilir. OpenAI, Sora’yı nesnelerin ve insanların tutarlı bir şekilde etkileşimde bulunduğu gerçekçi 3D ortamlarını simüle etme aracı olarak hayal etmektedir. Ek olarak, Sora popüler oyun Minecraft’i simüle edebilir, oyuncunun eylemlerini ve çevre dünyayı aynı anda üretebilir.

Etkileyici yeteneklerine rağmen, Sora’nın bazı eksiklikleri yok değildir. OpenAI, Sora’nın karmaşık sahnelerde ve belirli neden-sonuç durumlarında doğru fizikleri tekrar üretmede zorlanabileceğini kabul eder. Promptlerdeki uzamsal ayrıntılar yanlış yorumlanabilir, bu da üretilen videolarda hatalara yol açabilir. Ancak, bu sınırlamalar, OpenAI’nin devam eden araştırmalarıyla başarılı bir şekilde ele alınmaktadır.

The source of the article is from the blog toumai.es

Privacy policy
Contact