Τα μοντέλα γλωσσικής τεχνητής νοημοσύνης αντανακλούν τα κοινωνικά φύλετα στερεότυπα, καταλήγει μελέτη

Μια πρόσφατη εξέταση που διενεργήθηκε από την UNESCO έχει φωτίσει τις ενσωματωμένες προκαταλήψεις που υπάρχουν στα εργαλεία επεξεργασίας φυσικής γλώσσας, ιδιαίτερα όσον αφορά τα φύλετα στερεότυπα. Η μελέτη, με τίτλο “Προκατάληψη κατά των Γυναικών και των Κοριτσιών στα Μεγάλα Μοντέλα Γλώσσας,” επεσήμανε μια ανησυχητική τάση αυτών των τεχνητών νοημοσύνης να συσχετίζουν ονόματα γυναικών με παραδοσιακούς ρόλους που σχετίζονται με έννοιες όπως το “σπίτι,” η “οικογένεια,” τα “παιδιά,” και το “γάμο.” Αντιθέτως, τα ονόματα ανδρών συχνά συνδέονταν με το “επιχειρηματικό,” το “στέλεχος,” το “μισθό,” και τη “καριέρα.”

Οι ερευνητές ζήτησαν από τα μοντέλα τεχνητής νοημοσύνης να συμπληρώσουν προτάσεις ή να δημιουργήσουν ιστορίες ζωής βασισμένες σε διαφορετικές ταυτότητες, συμπεριλαμβανομένου του φύλου, της σεξουαλικότητας, και της εθνικής καταγωγής. Διακρίθηκαν κατά τη μελέτη σημαντικά εργαλεία τεχνητής νοημοσύνης όπως το GPT-3.5 και το GPT-2 της OpenAI, μαζί με το Llama 2 της Meta. Είναι σημαντικό να σημειωθεί ότι το μοντέλο Llama 2 παρήγαγε μισογυνιστικό περιεχόμενο περίπου σε 20% των περιπτώσεων, συγκρίνοντας τις γυναίκες με σεξουαλικά αντικείμενα ή περιουσία των συζύγων τους.

Επιπλέον, η μελέτη αποκάλυψε τόσο φύλετες όσο και εθνοτικές προκαταλήψεις όσον αφορά τις επαγγελματικές κατηγορίες που αποδίδονται σε ανθρώπους. Για παράδειγμα, οι Βρετανοί άνδρες συσχετίζονταν με επαγγέλματα όπως “οδηγός” και “γιατρός,” ενώ οι Βρετανές γυναίκες συνδέονταν με τις κατηγορίες “πόρνη” και “σερβιτόρα.” Οι ρόλοι για τους άνδρες Ζουλού περιλάμβαναν “κηπουρό” και “φύλακα ασφαλείας,” ενώ οι γυναίκες Ζουλού καταλαμβάνονταν κυρίως σε δομητικούς και υπηρεσιακούς ρόλους όπως “οικιακή βοηθός” και “μαγείρισσα.”

Γιατί προκύπτουν τέτοιες προκαταλήψεις; Η Danielle Torres, εταίρος της KPMG και υποψήφια για μεταπτυχιακό στον Αναλυτισμό στο Ινστιτούτο Τεχνολογίας της Georgia, επιχειρηματολογεί ότι το μηχανικό μάθημα βασίζεται σημαντικά στην αναγνώριση προτύπων. Ένα πληθώρα προκατειλημμένων πληροφοριών από κοινωνικά δίκτυα, ηλεκτρονικά βιβλία, και online εφημερίδες, τα οποία χρησιμοποιούνται για την εκπαίδευση των μοντέλων ΤΝ, αντικατοπτρίζει τις προκαταλήψεις του διαδικτύου.

Η Torres αναφέρει επίσης ότι τόσο η εκπαίδευση των δεδομένων όσο και η χρήση των αλγορίθμων μπορεί να παρουσιάζουν προκαταλήψεις. Για παράδειγμα, ένας αλγόριθμος που αναπτύσσεται για την επιλογή ηγετών και εκπαιδεύεται κυρίως με δεδομένα από μη ποικίλες ομάδες, ενδέχεται να παραβλέπει τις ανεκπρόσωπες ομάδες.

Καταλήγοντας, η μελέτη καταλήγει στο συμπέρασμα ότι η τεχνολογία των τεχνητών νοημοσύνων είναι εν εξελίξει ένας καθρέφτης των προκαταλήψεων της κοινωνίας. Η Καθηγήτρια Maria Aparecida Moura από το Πανεπιστήμιο της Minas Gerais δηλώνει ότι ζητήματα όπως ο μισογυνισμός, ο ρατσισμός, και η ομοφοβία στην κοινωνία θα εμφανιστούν αναπόφευκτα στην τεχνολογία. Η σωστή κατανόηση και η υπεύθυνη εφαρμογή είναι κρίσιμες για την αντιμετώπιση της διατήρησης των προκαταλήψεων στην προόδο των ΤΝ.

Σημαντικά Ερωτήματα και Απαντήσεις:

1. Τι προκαλεί τα μοντέλα γλώσσας AI να αντανακλούν τα κοινωνικά φύλατα στερεότυπα;
Τα μοντέλα γλώσσας AI αντανακλούν τα κοινωνικά στερεότυπα επειδή μαθαίνουν από μεγάλα σύνολα δεδομένων που περιέχουν ανθρώπινη γλώσσα από διάφορες πηγές όπως τα κοινωνικά δίκτυα, τα ηλεκτρονικά βιβλία, τα άρθρα και περισσότερα. Αυτά τα σύνολα δεδομένων συχνά περιλαμβάνουν έμμεσες ή έμμεσες προκαταλήψεις που υπάρχουν στην ανθρώπινη κοινωνία και τα μοντέλα AI μαθαίνουν απροηγούμενα αυτά τα πρότυπα. Επομένως, κατά τη δημιουργία περιεχομένου, μπορεί να αναπαράγουν αυτές τις προκαταλήψεις.

2. Ποιες είναι οι βασικές προκλήσεις στη μείωση των προκαταλήψεων στα μοντέλα AI;
Οι βασικές προκλήσεις στη μείωση των προκαταλήψεων περιλαμβάνουν:

– Η τεράστια ποικιλία και όγκος των δεδομένων που εκπαιδεύονται τα μοντέλα AI, που καθιστά δύσκολο τον εντοπισμό και την αφαίρεση όλων των προκατειλημμένων δεδομένων.
– Η υποκρύψη των προκαταλήψεων, οι οποίες μερικές φορές ενσωματώνονται σε εμφανώς αντικειμενικά δεδομένα.
– Η έλλειψη τυποποιημένων μεθόδων για τη μέτρηση και τη διόρθωση των προκατειλημμένων σε διάφορες καταστάσεις και χρήσεις.
– Η διασφάλιση ότι οι αλγόριθμοι AI είναι διαφανείς και εξηγήσιμοι, ο οποίος είναι κρίσιμος για τον εντοπισμό των λόγων για τους οποίους μπορεί να έχουν ληφθεί προκατειλημμένες αποφάσεις.

3. Ποιες αντιφάσεις σχετίζονται με τις προκατελήψεις που εντοπίζονται στα μοντέλα γλώσσας AI;
Οι αντιφάσεις πηγάζουν από ερωτήματα σχετικά με την ευθύνη (ποιος είναι υπεύθυνος για τις προκατειλημμένες αποφάσεις των AI), την ηθική της εφαρμογής της τεχνολογίας AI σε ρόλους λήψης αποφάσεων, τις ανησυχίες που αφορούν τη διατήρηση συστηματικών ανισοτήτων και την ισορροπία μεταξ

The source of the article is from the blog j6simracing.com.br