Οι μηχανικοί έρευνας της Adobe αναπτύσσουν εφαρμογή ενίσχυσης βίντεο με τεχνητή νοημοσύνη

Η καινοτομία της τεχνητής νοημοσύνης της Adobe Research ενισχύει την ευκρίνεια των βίντεο – Οι μηχανικοί της Adobe Research παρουσίασαν μια κορυφαία εφαρμογή τεχνητής νοημοσύνης γνωστή ως VideoGigaGAN. Αυτό το εργαλείο ΤΝ είναι σχεδιασμένο για να μετατρέπει δείγματα βίντεο που είναι ασαφή σε εντυπωσιακά πιο καθαρές εκδόσεις, προσφέροντας σημαντικά βελτιωμένη ευκρίνεια μετά την επεξεργασία.

Η ομάδα χρησιμοποίησε ένα δίκτυο GAN (generative adversarial network) με τη συγκεκριμένη πρόθεση να διδάξει στο σύστημα να αναγνωρίζει την ευκρίνεια και τη σαφήνεια του υψηλής ποιότητας βίντεο περιεχομένου — επικεντρώθηκαν σε λεπτομέρειες, όπως τις μεμβράνες των μαλλιών στα φρύδια, αντί για ένα απλό ασαφές σύνολο.

Εξασφαλίζοντας συνέπεια στα καρέ του βίντεο με προηγμένη τεχνητή νοημοσύνη – Για να διατηρήσουν τη συνεπή ποιότητα στα καρέ των βίντεο, οι ερευνητές της Adobe ενσωμάτωσαν ένα “flow-guided propagation module,” το οποίο είναι ζωτικό για τη συνοχή της οπτικής αφήγησης του βίντεο.

Η σύγκριση μεταξύ της μεθόδου της Adobe, που ονομάζεται “Δική μας,” και άλλων τεχνικών αποκαλύπτει τη μοναδική προσέγγιση που έχουν ακολουθήσει οι επιστήμονες. Η δημοσίευσή τους είναι διαθέσιμη στην πλατφόρμα arXiv.

Πώς η Γεννητική Ανταγωνιστική Δίκτυα βελτιώνουν την ποιότητα των βίντεο – Τα Γεννητικά Ανταγωνιστικά Δίκτυα αποτελούνται από δύο νευρωνικά δίκτυα — έναν γεννήτορα και έναν διακριτή — τα οποία εμπλέκονται σε ένα ανταγωνιστικό μάθησης. Ο ρόλος του γεννήτορα είναι να “απατήσει” τον διακριτή κάνοντάς τον να μπερδευτεί τα συνθετικά δεδομένα με πραγματικά δεδομένα, ενώ ο διακριτής στοχεύει στη βελτίωση της ικανότητάς του να διακρίνει μεταξύ των δύο.

Για να αμβληθούν πιθανά σφάλματα της ΤΝ και να αντιμετωπιστούν οι ξαφνικές πτώσεις της ποιότητας των βίντεο, οι ερευνητές εφάρμοσαν επίσης τεχνικές λείανσης και “ανακατευθώντας υψηλής συχνότητας λεπτομέρειες.”

Σύμφωνα με τους ερευνητές, το σύστημα έχει τη δυνατότητα να βελτιώσει την ποιότητα των βίντεο έως και οκτώ φορές. Σημαντικό είναι ότι αυτή η βελτίωση πραγματοποιείται χωρίς να εισάγονται κοινά προβλήματα όπως μη φυσιολογικά χρώματα ή σκαλισμένες γραμμές που συνήθως συνδέονται με την επεξεργασία βίντεο κίνησης με την ΤΝ.

Επανακαθορισμός ρεαλιστικών υφών βίντεο με ΤΝ – Οι προγραμματιστές αναγνωρίζουν ότι μια μεγάλη μερίδα του βίντεο εξόδου είναι πλήρως συνθετική από το VideoGigaGAN με βάση τις αξιολογήσεις του συστήματος. Η ΤΝ μπορεί να “σχεδιάζει” τα απαραίτητα στοιχεία, όπως τους πόρους στο δέρμα, τις ρυτίδες γύρω από τα μάτια ή ακόμα και τις βλεφαρίδες για να επιτύχει υψηλή ανάλυση.

Παραμένει να φανεί αν η Adobe θα δώσει στη δημοσιότητα αυτήν την εφαρμογή για δημόσια χρήση.

Στο παρελθόν, η Adobe εισήγαγε ένα νευρωνικό δίκτυο για τη δημιουργία μουσικής, με το όνομα Project Music GenAI Control, το οποίο επιτρέπει τη δημιουργία ήχου με βάση περιγραφές κειμένου.

Privacy policy
Contact