Υποχρέωση των Ανθραιπονων Γλωσσικών Μοντέλων: Ο Κλειδί για την Πρόοδο της Τεχνολογίας Τεράστιων Γλωσσικών Προτύπων

Ενώ η τεχνολογία του AI που δημιουργεί έχει προχωρήσει με γοργούς ρυθμούς τα τελευταία χρόνια, ο πρώην εκτελεστικός διευθυντής της Salesforce, Richard Socher, πιστεύει ότι υπάρχει ακόμα χώρος για βελτίωση. Σε ένα podcast του Harvard Business Review, ο Socher συζήτησε πώς μπορούμε να αναβαθμίσουμε τα μεγάλα γλωσσικά μοντέλα, πιέζοντάς τα να ανταποκρίνονται σε εντολές κώδικα αντί να προβλέπουν απλώς τον επόμενο σύμβολο.

Αυτήν την στιγμή, τα μεγάλα γλωσσικά μοντέλα εξαρτώνται από την πρόβλεψη του επόμενου συμβόλου βασισμένο σε προηγούμενα δεδομένα. Παρόλο που αυτά τα μοντέλα επιδεικνύουν εντυπωσιακή κατανόηση ανάγνωσης και δεξιότητες προγραμματισμού, συχνά αντιμετωπίζουν προβλήματα ψευδαισθήσεων, όπου παράγουν πραγματικά λάθη σαν να ήταν αληθινά. Αυτό γίνεται ιδιαίτερα προβληματικό όταν ανακύπτουν πολύπλοκες μαθηματικές ερωτήσεις.

Ο Socher παρείχε ένα παράδειγμα ενός ερωτήματος που ένα μεγάλο γλωσσικό μοντέλο θα αντιμετώπιζε με δυσκολία: “Εάν έδινα $5,000 σε ένα μωρό κατά τη γέννησή του για να επενδύσει σε ένα ενεργό χαρτοφυλάκιο με δείκτη, υπολογίζοντας ένα συγκεκριμένο ποσοστό μέσης επιτόκια ετησίως, πόσα θα έχει μεταξύ των δύο και των πέντε ετών;” Αντί να εξετάσει προσεκτικά το ερώτημα και να πραγματοποιήσει τους απαραίτητους υπολογισμούς, το μοντέλο θα παρήγαγε κείμενο βασισμένο σε παρόμοια ερωτήματα που είχε συναντήσει προηγουμένως.

Για να ξεπεραστεί αυτός ο περιορισμός, ο Socher προτείνει το “να αναγκασουμε” το μοντέλο να μεταφράσει το ερώτημα σε υπολογιστικό κώδικα και να παράξει μια απάντηση βασισμένη σε αυτόν τον κώδικα. Με αυτόν τον τρόπο, το μοντέλο είναι πιο πιθανό να παρέχει μια ακριβή απόκριση. Ο Socher ανέφερε επίσης ότι στη μηχανή αναζήτησης με τεχνητή νοημοσύνη, You.com, κατάφεραν να μεταφράσουν ερωτήσεις σε κώδικα Python.

Αντίθετα με τη συνηθισμένη προσέγγιση του απλού επιμερισμού δεδομένων και υπολογιστικής ισχύος, ο Socher υποστηρίζει ότι ο προγραμματισμός θα παίξει κρίσιμο ρόλο στην προαγωγή των μεγάλων γλωσσικών μοντέλων. Διδάσκοντας σε αυτά τα μοντέλα να προγραμματίζουν, θα αποκτήσουν μια βαθύτερη κατανόηση και πιο ευέλικτες ικανότητες επίλυσης προβλημάτων. Αυτή η προσέγγιση προγραμματισμού θα τους επιτρέψει να αντιμετωπίσουν πιο πολύπλοκες εργασίες στο μέλλον.

Καθώς ο ανταγωνισμός μεταξύ των μεγάλων γλωσσικών μοντέλων εντείνεται, με το GPT-4 της OpenAI και το Gemini της Google να ανταγωνίζονται για την κυριαρχία, η οπτική του Socher παρέχει μια νέα προοπτική για την προαγωγή των δυνατοτήτων της ΤΝ. Αντί να βασίζονται μόνο στην αύξηση των δεδομένων, η υποχρέωση των μοντέλων AI να προγραμματίζουν μπορεί να ξεκλειδώσει την πλήρη δυναμική τους και να οδηγήσει σε σημαντικές προόδους στον τομέα.

Συχνές Ερωτήσεις (FAQ) για τη Βελτίωση των Μεγάλων Γλωσσικών Μοντέλων μέσω Προγραμματισμού

Ε: Ποιο είναι το πρόβλημα με τα τρέχοντα μεγάλα γλωσσικά μοντέλα;
Α: Τα τρέχοντα μεγάλα γλωσσικά μοντέλα έχουν περιορισμούς στην παραγωγή ακριβών απαντήσεων όταν αντιμετωπίζουν πολύπλοκες ερωτήσεις, ιδιαίτερα εκείνες που απαιτούν μαθηματικούς υπολογισμούς. Συχνά αντιμετωπίζουν προβλήματα ψευδαισθήσεων, παράγοντας λάθη ως αληθή.

Ε: Ποια είναι η προτεινόμενη λύση για να ξεπεραστούν αυτοί οι περιορισμοί;
Α: Ο Richard Socher προτείνει να “αναγκάσουμε” τα μεγάλα γλωσσικά μοντέλα να μεταφράσουν τις ερωτήσεις σε υπολογιστικό κώδικα και να παράξουν απαντήσεις βασισμένες σε αυτόν τον κώδικα. Με αυτόν τον τρόπο, τα μοντέλα είναι πιο πιθανό να παρέχουν ακριβείς απαντήσεις.

Ε: Πώς βελτιώνεται το μοντέλο με τ

The source of the article is from the blog tvbzorg.com