Tõus tehisintellekti videote loomise tehnoloogias Hiinas on tekitamas elevust, sest on ilmunud uus mudel, mille kvaliteet ja jõudlus on võrreldav OpenAI ‘Soar’ omaga. Kuigi selle tehnoloogia ametlikku väljalaskmist pole veel toimunud ja autentsust tuleb kinnitada, on arendava ettevõtte poolt jagatud esialgne sisu pälvinud tähelepanu oma muljetavaldava kvaliteedi poolest.
7. märtsil teatas Tom’s Guide, et Hiina videoplatformifirma Kuaishou avaldas proovivideo, mis näitab nende tehisintellekti mudeli ‘Kling’ võimeid. Firma veebisait näitab proovivideoid, kus mudel demonstreerib võimet luua kuni kaheminutilisi videoid 30 kaadrit sekundis 1080p resolutsioonis ainult ühest käsklusest. Mudel suudab täpselt simuleerida reaalse maailma füüsikat, mis on osutunud teistele tehisintellekti mudelitele keeruliseks.
Kling kasutab sama ‘levitustransformaatori’ arhitektuuri mis Soar ja toetab erinevaid külgnäituse suhteid ja kaadrisuundi. Lisaks videote genereerimisele on Kuaishou avaldanud ka ‘AI-tantsija’ tööriista, mis suudab luua täispikkusega laulmise ja tantsimise 3D-videoid ainult ühest fotost.
Hetkel on Klingi kodulehekülg varustatud 13 proovivideoga, mis hõlmavad 12 viiesecondilist klippi ja ühte kestusega üks minut ja 31 sekundit. Firma avaldab uusi videoid oma ametliku YouTube’i kanali kaudu.
Tom’s Guide kiitis mudelit ja soovitas, et selle kvaliteet on nii lähedane Soarile, et see võiks selle ületada. Kuaishou on oluline tegija Hiina lühivormi videorakenduste turul, olles teisel kohal ainult TikToki õesrakenduse Douyin järel. Maikuus käivitas firma suure keelelise mudeli ‘KwaiYii’ ja pildi loomise mudeli ‘Kolors’.
Kuaishou on vihjanud, et Klingi mudeli poolt demonstreeritud funktsioonid viivad peagi uute pildilt video tegemise omaduste väljalaskmiseni.
Hiina tehisintellekti tõus videote loomise sektoris
Kunstlikeintellekti (AI) valdkond on kiiresti arenenud, eriti videote loomise tehnoloogias. Kuigi OpenAI Soar on varem olnud oluline mudel selles valdkonnas, näitab Hiina arendus Kuaishou ‘Kling’, et tööstuses on kasvav konkurents. See tehnoloogia võiks revolutsioneerida sisuloojate võimekust luua kvaliteetseid videoid kiiresti ja tõhusalt.
Üks oluline küsimus, mis sellest uudisest tõuseb: Kuidas võrdub Kling OpenAI Soariga võimekuse ja jõudluse poolest? Kuigi otseste võrdluste tegemine on keeruline ilma avaliku ligipääsuta Klingile ja täiendavate detailideta, näitavad teatatud omadused – realistlik füüsika simulatsioon, erinevad külgnäituse suhted ja reaalajas videote genereerimine – mudelit, mis vähemalt vastab Soari jõudlusele.
Olulised väljakutsed tehisintellekti videote genereerimisel hõlmavad reaalse ja sujuva materjali loomist, keeruka inimliikumise kordamist ja tagamist, et tehisintellekti loodud videod ei kasutataks kahjustavaid eesmärke, näiteks deepfake’id. Kontroversid võivad puudutada potentsiaalset väärkasutust, mõju loomingulistele tööstustele ja muresid intellektuaalomandi kohta.
Selliste tehisintellekti videote genereerimise mudelite eesmärgid hõlmavad:
– Produktiivsete tootmisliinide loomine filmitegijatele ja sisuloojatele
– Madalamad kulud kvaliteetse videomaterjali loomiseks
– Suurenenud loovus koos AI-genereritud stseenide ja karakteritega
puudused võivad aga hõlmata:
– Töö kadumise risk teatud video tootmise valdkonnas
– Eetilised mured sünteetilise meedia kasutamise üle
– Regulatiivsed väljakutsed ja valeinfo leviku võimalused
Arvestades selle läbimurde potentsiaalset mõju, on oluline säilitada dialoog vastutustundliku tehisintellekti kasutamise üle ning luua vajalikud raamistikud võimalike kahjulike mõjude leevendamiseks. Lisateavet uusimate tehisintellekti tehnoloogiatega seotud edusammude kohta saab leida usaldusväärsetest allikatest nagu OpenAI või tehnoloogiauudiste platvormidelt.