Η Νέα Τεχνολογία της Microsoft: Pix2Gif Μετατρέπει Ακίνητες Εικόνες σε Κινούμενα GIF

18 Μαρτίου, 2024
by
Microsoft Research Introduces New AI Tool for Image-to-GIF Conversion

Η ερευνητική κλάδος της Microsoft αποκάλυψε πρόσφατα ένα καινοτόμο μοντέλο τεχνητής νοημοσύνης με την ονομασία Pix2Gif, το οποίο μπορεί να μετατρέψει στατικές εικόνες σε κινούμενα GIF σε λίγα δευτερόλεπτα. Αυτό το καινοτόμο εργαλείο συνδυάζει είσοδο εικόνας με κείμενο οδηγιών για να μετασχηματίσει χωρικά τα χαρακτηριστικά της αρχικής εικόνας, δημιουργώντας δυναμικά και συναρπαστικά GIF.

Η διαδικασία παραγωγής ενός GIF από μια στατική εικόνα διαρκεί περίπου ένα λεπτό χρησιμοποιώντας την τρέχουσα έκδοση του Pix2Gif. Ωστόσο, είναι σημαντικό να σημειωθεί ότι με ένα γρηγορότερο γραφικό επεξεργαστικό μονάδα (GPU), το εργαλείο μπορεί να παράγει GIF σε ακόμα μικρότερο χρονικό διάστημα.

Για να εκπαιδευτεί το μοντέλο ΤΝ, οι ερευνητές χρησιμοποίησαν ένα μεγάλο σύνολο δεδομένων που αποτελείται από 100.000 κινούμενα GIF που συνοδεύονταν από σχετικές λεζάντες. Οι καρέ εξαχθήκαν από αυτά τα GIF και οι λεζάντες χρησιμοποιήθηκαν ως κείμενο οδηγία κατά τη διάρκεια της διαδικασίας εκπαίδευσης. Αυτή η ποικίλη συλλογή δεδομένων έχει δώσει στο Pix2Gif τη δυνατότητα να μετατρέψει εικόνες σε ζωντανά GIF που καθηλώνουν τους θεατές.

Αν και το μοντέλο αυτό της τεχνητής νοημοσύνης παραμένει κυρίως ένα ερευνητικό έργο, υπάρχουν πιθανότητες να ενσωματωθεί σε Ϯδη υφιστάμενα προϊόντα της Microsoft, όπως το Copilot, το Designer ή το Paint. Αυτή η ολοκλήρωση θα διευκολύνει τη διαδικασία ανιμάτιον και θα επιτρέψει στους χρήστες να εφαρμόζουν ενισχύσεις εικόνας με τη χρήση της τεχνητής νοημοσύνης.

Είναι σημαντικό να σημειωθεί ότι οι ερευνητές δεν έχουν αποκαλύψει την πηγή των GIF που χρησιμοποίησαν για την εκπαίδευση του μοντέλου. Σε περίπτωση που το Pix2Gif εξελιχθεί σε ένα πλήρως λειτουργικό προϊόν της Microsoft, η απόκτηση αδειοδοτημένων δεδομένων για την εκπαίδευση θα είναι αναγκαία.

Όσοι ενδιαφέρονται τώρα μπορούν να βιώσουν τη δύναμη του Pix2Gif σε ένα περιβάλλον δοκιμής, όπου οι χρήστες μπορούν να υποβάλουν μια εικόνα ή ένα κείμενο οδηγιών και να παρακολουθήσουν τη μεταμόρφωσή τους σε ένα ομαλό GIF. Η Microsoft επίσης σχεδιάζει να βελτιώσει τις δυνατότητες του εργαλείου, ενδεχομένως επεκτείνοντας τη λειτουργικότητά του σε εφαρμογές επεξεργασίας εικόνων.

Συχνές Ερωτήσεις (FAQ)

1. Τι είναι το Pix2Gif;
– Το Pix2Gif είναι ένα μοντέλο τεχνητής νοημοσύνης που αναπτύχθηκε από την ερευνητική κλάδο της Microsoft και μετατρέπει στατικές εικόνες σε κινούμενα GIF. Χρησιμοποιεί μια μοναδική προσέγγιση μετάφρασης εικόνας και επιτρέπει στους χρήστες να παρέχουν επιπλέον κείμενο οδηγιών για επεξεργασία.

2. Πώς λειτουργεί το Pix2Gif;
– Οι χρήστες καθοδηγούν το μοντέλο Pix2Gif παρέχοντας ένα κείμενο οδηγιών μαζί με την είσοδο της εικόνας. Ο αλγόριθμος της τεχνητής νοημοσύνης μετασχηματίζει χωρικά την αρχική εικόνα με βάση αυτή την καθοδήγηση, με αποτέλεσμα τη δημιουργία ενός GIF.

3. Πόσο χρόνο χρειάζεται για τη δημιουργία ενός GIF με το Pix2Gif;
– Προς το παρόν, το Pix2Gif χρειάζεται περίπου ένα λεπτό για να δημιουργήσει ένα GIF διάρκειας 2 δευτερολέπτων από μια στατική εικόνα. Ωστόσο, ο χρόνος επεξεργασίας μπορεί να μειωθεί περαιτέρω με τη χρήση ενός πιο γρήγορου GPU.

4. Ποια δεδομένα χρησιμοποιήθηκαν για την εκπαίδευση του μοντέλου Pix2Gif;
– Οι ερευνητές χρησιμοποίησαν ένα σύνολο δεδομένων που περιείχε περίπου 100.000 κινούμενα GIF με τις αντίστοιχες λεζάντες. Καρέ εξήχθησαν από αυτά τα GIF, και οι λεζάντες χρησιμοποιήθηκαν ως κείμενο οδηγίας κατά την εκπαίδευση.

5. Θα συμπεριληφθεί το Pix2Gif σε προϊόντα της Microsoft;
– Παρόλο που το Pix2Gif είναι αυτή τη στιγμή μια έρευνα, η Microsoft εξετάζει την ενσωμάτωσή του σε υφιστάμενα προϊόντα όπως το Copilot, το Designer ή το Paint. Μια τέτοια ολοκλήρωση θα απλοποιήσει τη διαδικασία ανιμάτιον και θα προσφέρει ενισχύσεις εικόνας με τη χρήση της τεχνητής νοημοσύνης.

The source of the article is from the blog girabetim.com.br

Privacy policy
Contact

Don't Miss

The Race for AI Supremacy: China’s Pursuit of OpenAI

Η Νέα Αντίληψη της Τεχνητής Νοημοσύνης: Η Εξέλιξη της Κινεζικής Αγοράς AI

Εισαγωγή Η Κίνα, γνωστή για τις γρήγορες εξελίξεις στην τεχνολογία,
AI and Songwriting: A New Frontier in Music Creation

Τίτλος: ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ ΚΑΙ ΣΥΝΘΕΣΗ ΤΡΑΓΟΥΔΙΩΝ: Ένα νέο μέτωπο στη μουσική δημιουργία

Περίληψη: Κατά τη διάρκεια συζήτησής του για το επερχόμενο άλμπουμ