Μια σημαντική έρευνα από το Technology News αποκάλυψε ένα πολύ συζητηθέν αποτέλεσμα στον χώρο της ανάπτυξης της τεχνητής νοημοσύνης. Οι γίγαντες της βιομηχανίας έχουν χρησιμοποιήσει τα μοντέλα τους AI που έχουν εκπαιδευτεί σε ένα στρωμένο σύνολο δεδομένων που αποτελείται από πάνω από 173.000 βίντεο κλιπ του YouTube χωρίς συγκατάθεση.
Το σύνολο δεδομένων, που πρωτοστατεί η μη κερδοσκοπική οντότητα EleutherAI, περιλαμβάνει αποσπάσματα από βίντεο του YouTube που προέρχονται από πάνω από 48.000 κανάλια, με εταιρίες όπως η Apple, η NVIDIA και η Anthropic ανάμεσα σε αυτούς που εκμεταλλεύτηκαν το σύνολο αυτό. Αυτό φωτίζει την απρόσμενη πραγματικότητα της τεχνολογίας της τεχνητής νοημοσύνης να βασίζεται σε μεγάλο βαθμό σε δεδομένα που εξάγονται από δημιουργούς περιεχομένου χωρίς τη συγκατάθεσή τους ή αποζημίωση.
Σε αντίθεση με το αρχικό περιεχόμενο, το σύνολο αυτό δεδομένων δεν περιλαμβάνει πραγματικά βίντεο κλιπ, αλλά κυρίως κειμενικά δεδομένα από κορυφαίους παραγωγούς πλατφορμών όπως ο Marques Brownlee και ο MrBeast, μαζί με κυρίαρχους εκδότες ειδήσεων όπως τα The New York Times, BBC και ABC News. Οι μεταγραφές από βίντεο κλιπ του Engadget συμβάλλουν επίσης σε αυτό το σύνολο δεδομένων, εξετάζοντας ένα διαφιλοσοφικό δίλημμα στον χώρο της τεχνητής νοημοσύνης.
Η Apple φέρεται να έχει αποκτήσει δεδομένα AI από διάφορες πηγές, συμπεριλαμβανομένης της εκχύλισης δεδομένων από βίντεο κλιπ του YouTube, μια πρακτική που δημιουργεί ηθικές ανησυχίες. Μέσα σε αυτή την αποκάλυψη, εταιρίες όπως η Apple και η NVIDIA έχουν παραμείνει σιωπηλές σε αιτήσεις για σχόλια, υπογραμμίζοντας την έλλειψη διαφάνειας σχετικά με τα δεδομένα που χρησιμοποιούνται για την εκπαίδευση μοντέλων AI.
Το YouTube, ως ένας κολοσσιαίος χώρος αποθήκευσης βίντεο παγκοσμίως, αποτελεί ένα πολυπόθητο θησαυροφυλάκιο για την εκπαίδευση μοντέλων τεχνητής νοημοσύνης, που δεν περιορίζεται μόνο σε κείμενο, αλλά επεκτείνεται σε φωνή, βίντεο και εικόνες. Οι ηθικές συζητήσεις περί της χρήσης δεδομένων από το YouTube για την εκπαίδευση μοντέλων AI συνεχίζουν να κλιμακώνονται, τονίζοντας τη σημασία της διαφάνειας και της συναίνεσης σε αυτό το εξελισσόμενο τεχνολογικό τοπίο.