Νέες Τεχνικές Εκπαίδευσης Τεχνητής Νοημοσύνης χωρίς Παραβίαση Πνευματικών Δικαιωμάτων

21 Μαρτίου, 2024
by
Unlocking the Potential of AI Training without Copyright Infringement

Οι μοντέλα Τεχνητής Νοημοσύνης (ΤΝ) έχουν επιδραστικά εκπαιδευτεί χρησιμοποιώντας υλικό που καλύπτεται από πνευματικά δικαιώματα, αλλά πρόσφατες εξελίξεις υποδηλώνουν ότι υπάρχουν εναλλακτικοί τρόποι για την εκπαίδευση αυτών των μοντέλων χωρίς να παραβιάζονται τα πνευματικά δικαιώματα. Μια ομάδα ερευνητών υποστηριζόμενη από τη γαλλική κυβέρνηση έχει δημοσιεύσει ένα σημαντικό σύνολο δεδομένων εκπαίδευσης ΤΝ που αποτελείται αποκλειστικά από κείμενα στο κοινό κτήμα. Αυτό το καινοτόμο σύνολο δεδομένων παρέχει αποδείξεις ότι μεγάλα μοντέλα γλωσσικής ανάπτυξης μπορούν να εκπαιδευτούν χωρίς την ανάγκη για μη εξουσιοδοτημένη χρήση υλικού με πνευματικά δικαιώματα.

Η μη κερδοσκοπική οργάνωση Αδόκιμα Εκπαιδευμένος ανακοίνωσε επίσης ότι έχει πιστοποιήσει επιτυχώς το πρώτο μεγάλο μοντέλο γλωσσικής ανάπτυξης του, με την ονομασία KL3M. Αυτό το μοντέλο αναπτύχθηκε από την 273 Ventures, μια startup νομικής τεχνολογίας με έδρα το Σικάγο, χρησιμοποιώντας ένα σύνολο δεδομένων εκπαίδευσης αποτελούμενο από νομικά, χρηματοοικονομικά και ρυθμιστικά έγγραφα. Ακολουθώντας τους νόμους πνευματικών δικαιωμάτων και χρησιμοποιώντας το δικό τους σύνολο δεδομένων, η 273 Ventures έχει δείξει ότι είναι δυνατή η κατασκευή μεγάλων μοντέλων γλωσσικής ανάπτυξης χωρίς το αμφιλεγόμενο θέμα της παραβίασης πνευματικών δικαιωμάτων.

Σύμφωνα με την Jillian Bommarito, τη συνιδρύτρια της 273 Ventures, η απόφασή τους να εκπαιδεύσουν το KL3M χρησιμοποιώντας το δικό τους σύνολο δεδομένων ήταν καθοδηγούμενη από τους επιφυλακτικούς πελάτες τους στον νομικό τομέα. Αυτοί οι πελάτες ανησυχούσαν για την προέλευση των δεδομένων και ήθελαν διαβεβαιώσεις ότι το μοντέλο AI τους δεν βασίζεται σε κατεστραμμένα ή δικαιώματα πνευματικής ιδιοκτησίας. Χρησιμοποιώντας ένα προσεκτικά συγκεντρωμένο σύνολο δεδομένων, η Bommarito υπογραμμίζει ότι το μέγεθος του μοντέλου δεν χρειάζεται να είναι τεράστιο και ότι η υψηλής ποιότητας δεδομένα μπορούν να οδηγήσουν σε καλύτερη απόδοση και εξειδίκευση.

Ενώ τα σύνολα δεδομένων όπως το KL3M είναι περιορισμένα σε μέγεθος σε σχέση με αυτά που συγκεντρώνονται από κολοσσούς της βιομηχανίας όπως η OpenAI, υπάρχει ελπίδα για το μέλλον. Πρόσφατα, ερευνητές έχουν δημοσιεύσει το Common Corpus, που υποστηρίζουν ότι είναι το μεγαλύτερο διαθέσιμο σύνολο δεδομένων για μοντέλα γλωσσικής ανάπτυξης αποτελούμενο αποκλειστικά από περιεχόμενο στο κοινό κτήμα. Αυτό το σύνολο δεδομένων, δημοσιευμένο στην πλατφόρμα τεχνητής νοημοσύνης ανοιχτού κώδικα Hugging Face, περιλαμβάνει κείμενα από εφημερίδες στο κοινό κτήμα ψηφιοποιημένες από θεσμούς όπως η Βιβλιοθήκη του Κογκρέσου των Ηνωμένων Πολιτειών και η Εθνική Βιβλιοθήκη της Γαλλίας. Το Common Corpus στοχεύει στο να παρέχει στους ερευνητές και τις startups ένα έλεγχο σύνολο εκπαίδευσης που είναι απαλλαγμένο από ανησυχίες πνευματικών δικαιωμάτων.

Παρόλο που τα σύνολα δεδομένων αποτελούμενα από περιεχόμενο στο κοινό κτήμα έχουν τους περιορισμούς τους, όπως η πιθανή περιεκτικότητα από ξεπερασμένες πληροφορίες, προσφέρουν έναν ανεκτίμητο πόρο για την εκπαίδευση μεγάλων μοντέλων γλώσσας. Έργα όπως το Common Corpus και το KL3M δείχνουν μια αυξανόμενη διστακτικότητα στην κοινότητα της ΤΝ απέναντι στο επιχείρημα της ανεξέλεγκτης προσπέλασης δεδομένων. Για να υποστηρίξουν αυτήν την τάση, η Αδόκιμα Εκπαιδευμένος πιστοποίησε πρόσφατα την πρώτη εταιρεία που προσφέρει μοντέλα φωνητικής τεχνητής νοημοσύνης, δείχνοντας ότι στη βιομηχανία υπάρχει μια αυξανόμενη τάση προς την απόκτηση κανονικών αδειών και τον σεβασμό των πνευματικών δικαιωμάτων.

Συχνές Ερωτήσεις (FAQ)

Privacy policy
Contact

Don't Miss

Innovative AI Model from Microsoft and Providence Transforms Cancer Diagnosis

Καινοτόμο Μοντέλο Τεχνητής Νοημοσύνης από τη Microsoft και την Providence Μετασχηματίζει τη Διάγνωση του Καρκίνου

Η Πολυοργανισμική Συνεργασία Οδηγεί σε Καινοτόμο Εφαρμογή Νοημοσύνης Τεχνητής Νοημοσύνης
The Dawn of AI-Composed Music with Suno AI

Η Αυγή της μουσικής που συνθέτει το AI με το Suno AI

Το μουσικό τοπίο βρίσκεται σε μετασχηματισμό με την άφιξη της