Значително разследване от Technology News разкри скандално обнаружение в областта на развитието на изкуствен интелект. Индустриалните гиганти използват своите модели на изкуствен интелект, обучени по отбранен набор от данни, състоящ се от над 173 000 видеоклипа на YouTube без съгласие.
Наборът от данни, предвождан от непристопния елемент EleutherAI, включва откъси от видеоклипове на YouTube, добити от повече от 48 000 канала, като компании като Apple, NVIDIA и Anthropic сред тези, които са се възползвали от него. Това разкрива неудобната реалност, че технологията на изкуствения интелект е силно зависима от данни, извлечени от създатели на съдържание без техните съгласия или компенсации.
За разлика от оригиналното съдържание, наборът от данни не съдържа фактически видеоклипове, а по-скоро текстови данни от топ създатели на платформи като Marques Brownlee и MrBeast, заедно с големите новинарски издатели като The New York Times, BBC и ABC News. Транскрипциите от видеоклиповете на Engadget също допринасят за този набор от данни, залагайки се на контроверзното етично дилема в областта на изкуствения интелект.
Съобщава се, че Apple е придобила данни за изкуствен интелект от различни източници, включително сканиране на данни от видеоклипове на YouTube, практика, която повдига етични въпроси. В светлината на това разкритие, компании като Apple и NVIDIA са мълчаливи по отношение на исканията за коментар, подчертавайки липсата на прозрачност относно данните, използвани за обучението на моделите на изкуствения интелект.
YouTube, като колосален резервоар на видеоконтент по целия свят, се явява като желан златен рудник за обучението на модели на изкуствен интелект, не само до текстова информация, но и до гласа, видеото и изображенията. Етичните дебати около използването на данни от YouTube за обучение на модели на изкуствен интелект продължават да нарастват, подчертавайки важността на прозрачността и съгласието в този развиващ се технологичен пейзаж.
Надалевска се разкриват нови измерения в етичните дискусии относно обучението на изкуствения интелект.
В непрекъснатия диалог относно обучението на модели на изкуствения интелект са налице допълнителни разкрития, които акцентират върху критични аспекти, изискващи внимание и разискване.
Едно от ключовите въпроси, които възникват, е докъде трябва да имат контрол създателите на съдържание върху своя материал, когато той се използва за обучение на интелигентни системи? Следва ли да има формализирани споразумения или структури за компенсация, за да се гарантира справедливо използване на данните, особено когато те произлизат от платформи като YouTube?
Друг важен въпрос се върти около прозрачността, поддържана от участниците в индустрията при добиване на данни за обучение на интелигентни системи. Как могат компании като Apple и NVIDIA да подобрят комуникационните си и разкривателни процеси, за да се справят с етични възгледи и да запазят доверие както с потребителите, така и със създателите на съдържание?
Един от основните предизвикателства, свързани с използването на големи набори от данни от платформи като YouTube, е възможното нарушаване на правата върху интелектуалната собственост. Етичното дилема възниква, когато интелигентните системи са обучени с данни без явно съгласие, повдигайки въпроси за поверителност, авторски права и права на собственост.
Предимствата на използването на обширни репозитории като YouTube за обучение на интелигентни системи включват достъп до разнообразни и обширни данни, които могат да подобрят производителността и възможностите на моделите на интелигентни системи. Това предимство обаче се противопоставя на нееднообразните импликации и необходимостта от строги етични рамки, които да насочват отговорното използване на такива данни.
Споровете, свързани с използването на видеоклипове от YouTube за обучение на интелигентни системи, подчертават важността на установяването на ясни насоки, получаването на съгласие и гарантирането на отговорност в процеса на развитие на интелигентните системи. Докато технологичните напредъци продължават да разширяват граници, става все по-императивно да се справяме с етичните предизвикателства проактивно.
За допълнителни прозорец в етичните измерения на обучението на интелигентни системи и използването на данни, можете да разгледате статии на Technology News.