Die Zukunft von KI-Modellen: Neue Ufer mit Bildmaterial von Photobucket

Photobucket, einst die führende Bildhosting-Website in den frühen 2000er Jahren, hat im Laufe der Jahre einen signifikanten Rückgang der Nutzerzahlen verzeichnet. Doch das Unternehmen könnte nun eine neue Perspektive gewinnen, indem es seine riesige Sammlung von 13 Milliarden Fotos und Videos für das Training von generativen KI-Modellen lizenziert.

CEO Ted Leonard enthüllte, dass Photobucket derzeit Gespräche mit mehreren Technologieunternehmen über die Lizenzierung seines umfangreichen Contents führt. Generative KI-Modelle sind auf große Datensätze angewiesen, um zu lernen und neue Inhalte in Reaktion auf Texteingaben zu generieren. Die diskutierten potenziellen Deals reichen von 5 Cent bis zu 1 US-Dollar pro Foto und über 1 US-Dollar pro Video, wobei die Preise je nach den Anforderungen des Käufers variieren.

Während Photobucket die Identität seiner potenziellen Käufer aufgrund vertraulicher Geschäftsgeheimnisse nicht offengelegt hat, werfen diese Verhandlungen ein Licht auf den aufstrebenden Datenmarkt rund um die generative KI-Technologie. Branchenriesen wie Google, Meta und das von Microsoft unterstützte OpenAI stützten sich zunächst darauf, Daten kostenlos aus dem Internet zu extrahieren, um ihre KI-Modelle zu trainieren. Doch nun erkunden sie bezahlte Alternativen, darunter die Lizenzierung von Inhalten, die hinter Paywalls und Anmeldeseiten versteckt sind.

Die Anwaltskanzlei Klaris Law gab bekannt, dass sie Content-Eigentümer bei Lizenzdeals im Wert von mehreren zehn Millionen US-Dollar berät, um Unternehmen die Lizenzierung von Archiven von Fotos, Filmen und Büchern für das KI-Training zu ermöglichen. Dieser verborgene Handel mit Daten hat Bedenken bezüglich der Verwendung persönlicher Daten in KI-Modellen ohne das Wissen oder die ausdrückliche Zustimmung der Betroffenen aufgeworfen und Diskussionen über Datenschutz und Ethik angestoßen.

Der undurchsichtige KI-Datenmarkt wurde bislang nicht umfassend untersucht, aber Schätzungen deuten darauf hin, dass er derzeit einen Wert von rund 2,5 Milliarden US-Dollar hat und innerhalb eines Jahrzehnts auf fast 30 Milliarden US-Dollar anwachsen könnte. Mit der steigenden Nachfrage nach generativen KI-Modellen bemühen sich Unternehmen, ihre Datenlieferketten abzusichern. Sie schließen Vereinbarungen mit Content-Eigentümern wie beispielsweise Stock-Image-Anbietern wie Shutterstock, um auf ihre umfangreichen Archive von Bildern, Videos und Musikdateien zuzugreifen.

Neben etablierten Playern wie Shutterstock schließen auch kleinere Technologieunternehmen ähnliche Lizenzabkommen, um die erforderlichen Daten für das KI-Training zu sichern. Dieser Trend hat zur Entstehung spezialisierter KI-Datenunternehmen geführt, die sich auf die Beschaffung von Inhalten spezialisieren, sei es durch Lizenzverträge oder maßgeschneiderte Produktion mithilfe von kurzfristigen Vertragsarbeitern.

Mit der Weiterentwicklung der KI-Branche wird der Fokus auf „ethisch beschafften“ Inhalten immer wichtiger. Während Unternehmen komplexe Datenvereinbarungen treffen, müssen sie auch Bedenken hinsichtlich Urheberrechtsverletzungen und Datenschutzverletzungen angehen. Das Wachstum des KI-Datenmarktes bietet Content-Eigentümern die Möglichkeit, ihre Sammlungen zu monetarisieren, unterstreicht aber auch die Notwendigkeit einer erhöhten Transparenz und Sicherheitsvorkehrungen zum Schutz der Datenrechte Einzelner.

FAQ

1. Was ist generative KI?
Generative KI bezieht sich auf einen Bereich der künstlichen Intelligenz, der große Datensätze verwendet, um neue Inhalte in Reaktion auf Texteingaben zu lernen und zu generieren. Sie basiert darauf, Modelle zu trainieren, um Muster zu verstehen und einzigartige Ausgaben zu generieren.

2. Wie plant Photobucket, seinen Inhalt für generative KI zu nutzen?
Photobucket führt Gespräche mit Technologieunternehmen, um seine umfangreiche Sammlung von Fotos und Videos zu lizenzieren. Diese Assets werden verwendet, um generative KI-Modelle zu trainieren, die in der Lage sind, neue Inhalte auf der Grundlage von Texteingaben zu erstellen.

3. Welche Bedenken gibt es hinsichtlich der Verwendung persönlicher Daten in KI-Modellen?
Die Verwendung persönlicher Daten in KI-Modellen ohne ausdrückliche Zustimmung wirft Datenschutzbedenken auf. Es gilt sicherzustellen, dass personenbezogene Daten ethisch erfasst und verwendet werden, und angemessene Sicherheitsmaßnahmen zum Schutz der Rechte Einzelner getroffen werden.

4. Wie groß ist der KI-Datenmarkt?
Der KI-Datenmarkt ist ein aufstrebendes Feld, dessen genaue Größe schwer zu schätzen ist. Einige Studien legen nahe, dass er derzeit einen Wert von etwa 2,5 Milliarden US-Dollar hat und binnen eines Jahrzehnts auf fast 30 Milliarden US-Dollar anwachsen könnte.

5. Wie sichern Unternehmen ihre Datenlieferketten für das KI-Training ab?
Unternehmen schließen Lizenzvereinbarungen mit Content-Eigentümern, um auf ihre Archive von Bildern, Videos und anderen relevanten Daten zuzugreifen. Darüber hinaus hilft die Entstehung spezialisierter KI-Datenunternehmen bei der Beschaffung von Inhalten und der Gewährleistung der ethischen Verwendung von Daten.

Quelle:
– Reuters

The source of the article is from the blog regiozottegem.be

Privacy policy
Contact