Η καινοτόμος τεχνητή νοημοσύνη μετατρέπει μια μόνο εικόνα και ήχο σε ρεαλιστικά βίντεο

Η άλματα της Microsoft στον ρεαλιστικό συντονισμό AI βίντεο έχει κάνει αίσθηση με την τελευταία της δημιουργία, το VASA-1. Αυτό το επαναστατικό μοντέλο μηχανικής μάθησης μπορεί να πάρει μια εικόνα ενός ατόμου και ένα συνοδευτικό ακουστικό κομμάτι και να τα μετατρέψει σε ένα πιστευτό βίντεο του ατόμου να μιλάει. Πριν από λίγα χρόνια, τα χαρακτηριστικά των δημιουργιών της AI αναγνωρίζονταν εύκολα, όπως οι λαθεμένοι μετρητές δακτύλων ή οι αναλογίες των άκρων, χωρίς να αναφέρουμε την ανθεκτική ποιότητα των βίντεο που δημιουργούνται από την τεχνητή νοημοσύνη.

Οι πρόσφατες εξελίξεις, ωστόσο, ζωγραφίζουν μια διαφορετική εικόνα. Η έρευνα της Microsoft αποκαλύπτει έντονη μετατόπιση προς αθέατο AI-δημιουργημένο περιεχόμενο, με το VASA-1 να κατευθύνει τη πορεία. Με την ανάλυση των λειτουργιών μιας παρουσίασης, το μοντέλο μπορεί να δημιουργήσει μια σειρά εικόνων που συγχρονίζουν τις κινήσεις του προσώπου με τον ήχο, δημιουργώντας μια ψευδαίσθηση φυσικού λόγου.

Ορισμένα δείγματα που κυκλοφορούν από τη Microsoft επιδεικνύουν τον εντυπωσιακό δυναμικό του VASA-1, ενώ άλλα αποτυπώνουν ότι η τεχνολογία είναι ακόμα σε εξέλιξη, καθώς η δυνατότητα διάκρισης των AI-γεννημένων μέσων από την πραγματικότητα παραμένει. Παρά ταύτα, το εντυπωσιακό χαρακτήρα αυτών των παραδειγμάτων λειτουργεί ως μαρτύριο της γρήγορης εξέλιξης των δυνατοτήτων της AI.

Η ανάπτυξη του VASA-1 λειτουργεί σε τυπικούς φορητούς υπολογιστές, όπως εκείνους εξοπλισμένους με ένα GPU RTX 4090, υποδεικνύοντας την προσβασιμότητα στη δημιουργία βαθιών ψευδαισθήσεων με καταναλωτικό υλικό. Η Microsoft επιμένει στη θέση της κατά της κατάχρησης της τεχνολογίας τους για απατηλούς σκοπούς και επιμένει στο ενδιαφέρον της να εφαρμόσει το VASA-1 για βελτίωση της εντοπισμού των πλαστογραφιών.

Αν και η έρευνα για το VASA-1 είναι εμπιστευτική, η προοπτική χρήσης τέτοιων μοντέλων για τη δημιουργία και την εντοπισμό πλαστογραφιών υποδηλώνει ένα μέλλον όπου η διάκριση μεταξύ υπολογιστικών ψευδαισθήσεων μπορεί να γίνει πιο εύκολα για τους καθημερινούς χρήστες.

The source of the article is from the blog klikeri.rs

Privacy policy
Contact