Συνδυάζοντας Διαφορετικές Προσεγγίσεις και Στρατηγικές: Ενίσχυση της Δημιουργικότητας στα AI Προγράμματα Σκακιού

Όταν η Covid-19 ανάγκασε τους ανθρώπους να μείνουν στα σπίτια τους πέρσι, ο επιστήμονας υπολογιστών Tom Zahavy ξαναανακάλυψε την αγάπη του για το σκάκι. Εμπνευσμένος από την ανάγνωση της αυτοβιογραφίας του Garry Kasparov, ο Zahavy εμβαθύνθηκε σε βίντεο και ταινίες σχετικά με το σκάκι όπως το “The Queen’s Gambit” για να τροφοδοτήσει το νέο ενδιαφέρον του. Ωστόσο, ο Zahavy σύντομα συνειδητοποίησε ότι ήταν πιο επιδέξιος στα γρίφους σκακιού παρά στο πραγματικό παιχνίδι. Αυτοί οι γρίφοι παρουσίαζαν τεχνητά σενάρια που προκαλούσαν τους παίκτες να βρουν καινοτόμους τρόπους να κερδίσουν πλεονέκτημα.

Ιδιαιτέρως, αυτοί οι γρίφοι σκακιού βοήθησαν να φωτίσουν τους περιορισμούς των παραδοσιακών προγραμμάτων σκακιού. Ο μαθηματικός Sir Roger Penrose δημιούργησε έναν γρίφο το 2017 που ακόμα και τα ισχυρότερα προγράμματα υπολογιστών σκακιού απέτυχαν να επιλύσουν σωστά. Ο Zahavy αναγνώρισε ότι ενώ οι υπολογιστές θα μπορούσαν να ξεπεράσουν τους ανθρώπους στο κανονικό παιχνίδι, αντιμετώπιζαν δυσκολίες στην αντιμετώπιση πολύπλοκων προβλημάτων εκτός των δεδομένων εκπαίδευσής τους.

Ο Zahavy, ερευνητής στη Google DeepMind, είδε αυτή την ανακάλυψη ως μια ευκαιρία να εξερευνήσει τη δημιουργική επίλυση προβλημάτων σε συστήματα AI. Αυτός και η ομάδα του ανέπτυξαν μια μοναδική προσέγγιση: συνδυάζοντας έως 10 συστήματα λήψης αποφάσεων AI που είχαν βελτιστοποιηθεί για διαφορετικές στρατηγικές. Ενσωμάτωσαν το AlphaZero της DeepMind, ένα ισχυρό πρόγραμμα σκακιού, ως αφετηρία. Συνεργαζόμενοι και εκμεταλλευόμενοι τα πλεονεκτήματα κάθε συστήματος, το νέο πρόγραμμα ξεπέρασε το AlphaZero μόνο του και επέδειξε αυξημένη ικανότητα και δημιουργικότητα στην επίλυση των γρίφων του Penrose. Κάθε φορά που μια προσέγγιση αντιμετώπιζε εμπόδιο, το πρόγραμμα μετέπεφτε άνευ ενός-αποσπώμενα σε μια άλλη.

Η επιτυχία της προσέγγισης του Zahavy είχε αντίκτυπο στην επιστήμονα των υπολογιστών Allison Liemhetcharat. Αναγνώρισε τα πλεονεκτήματα της χρήσης ποικίλων συστημάτων AI, ιδιαίτερα σε σενάρια επίλυσης προβλημάτων εκτός σκακιού. Η Liemhetcharat τόνισε ότι η ύπαρξη μιας ομάδας πρακτόρων εκπαιδευμένων σε διαφορετικούς τομείς αυξάνει τις πιθανότητες αντιμετώπισης δύσκολων προκλήσεων με αποτελεσματικό τρόπο.

Αυτή η έρευνα υποδεικνύει ότι τα συστήματα AI μπορούν να ωφεληθούν από τη συνεργατική επίλυση προβλημάτων και την εξερεύνηση πολλαπλών λύσεων. Αναζητώντας εναλλακτικές προσεγγίσεις, τα συστήματα AI μπορούν να ξεπεράσουν τους περιορισμούς τους και να προσφέρουν καινοτόμες λύσεις.

Το έργο του Zahavy αντιμετωπίζει επίσης τους περιορισμούς της ενίσχυσης μάθησης, τη βάση που βρίσκεται πίσω από ισχυρά προγράμματα σκακιού όπως το AlphaZero. Παρόλο που η ενίσχυση μάθησης επιτρέπει στα συστήματα AI να μαθαίνουν και να βελτιώνονται μέσω δοκιμών και σφαλμάτων, συχνά αποτυγχάνει να αναπτύξει μια ολιστική κατανόηση του παιχνιδιού. Ο Zahavy παρατήρησε ότι αυτά τα συστήματα είχαν τυφλά σημεία όταν πρόκειται για νέες καταστάσεις ή προβλήματα που δεν είχαν αντιμετωπίσει ξανά. Η αδυναμία αναγνώρισης της αποτυχίας εμπόδιζε τη δυνατότητά τους να εκφράσουν δημιουργικότητα.

Κινούμενος προς τα εμπρός, η έρευνα του Zahavy προτρέπει στην ενσωμάτωση της αναγνώρισης της αποτυχίας και της δημιουργικής επίλυσης προβλημάτων στα συστήματα AI. Μέσω αυτής της διαδικασίας, τα προγράμματα AI μπορούν να ξεπεράσουν τα τυφλά σημεία τους, να διευρύνουν τις ικανότητές τους στην επίλυση προβλημάτων και να προσφέρουν πιο διακριτικές λύσεις.

The source of the article is from the blog macnifico.pt