디지털 콘텐츠 도용: AI 개발에 대한 영향

AI 교육에 YouTube 동영상을 활용하는 기술 기업들

인공지능 분야의 기술 기업들은 인공지능 모델을 구축하기 위해 YouTube 비디오 등의 디지털 콘텐츠 다방면을 활용하는 논란이 있는 방법을 사용하고 있습니다. 적절한 동의 없이 소셜 미디어, 웹사이트, 사진 및 게시물 등의 자료들이 AI 개발에 활용되고 있습니다.

윤리적으로 문제되는 데이터 소싱 발견하기

최근 조사 결과, 앤쏘픽, 엔비디아, 애플, 세일즈포스 등 실리콘밸리의 주요 기업들이 48,000개 이상의 채널에서 추출한 173,536개 이상의 YouTube 동영상의 자막을 활용했다는 것이 밝혀졌습니다. ‘YouTube Subtitles’라는 데이터셋은 칸 아카데미, MIT, 하버드와 같은 교육 채널, 그리고 월스트리트저널, NPR, BBC 등의 주류 언론에서 사용된 다음 급 AI 모델 훈련을 위한 텍스트를 포함하고 있습니다.

창작자로부터 일어나는 불법적 사용에 대한 항의

“데이비드 팩만 쇼” 진행자인 데이비드 팩만 같은 창작자들은 무단으로 동영상이 활용된 사실에 이의를 제기했습니다. 콘텐츠 사용에 대한 보상 부족으로 창작자들 사이에서 우려가 제기되었으며, AI 데이터 소싱 관행에서의 인정과 공정한 보상의 필요성을 강조했습니다.

AI를 위한 데이터 획득에 대한 논란

동의 없이 데이터를 통합하는 것은 AI 분야에서 여전히 문제를 야기하고 있습니다. 산업 전문가들의 점차적인 검토와 함께, AI 개발을 위한 윤리적 데이터 소싱에 대한 논쟁이 기술적 토론의 선두주자로 남아 있습니다.

산업 거물들의 반응과 비판

애플 같은 기업들은 자사의 AI 프로젝트에 YouTube 콘텐츠를 사용하지 않는다고 주장하고 있지만, 다른 기업인 일루터AI는 YouTube, 위키피디아, 법적 단체 등의 적절한 승인을 받지 않고 데이터를 집계함으로써 비판을 받았습니다. 계속되는 비판은 AI의 발전을 위한 디지털 콘텐츠 활용에 대한 엄격한 윤리 표준의 중요성을 강조합니다.

AI 개발에서 디지털 콘텐츠 도용에 관한 새로운 발견

인공지능 (AI) 개발 분야에서 최근의 조사 결과에 따르면, 기술 기업들이 자사의 AI 모델 훈련을 위해 활용하는 디지털 콘텐츠 도용의 정도를 밝혀냈습니다. YouTube 동영상 이외에도, 소셜 미디어 플랫폼의 이미지, 웹사이트의 기사, 사용자 생성 게시물 등 다양한 형태의 디지털 콘텐츠가 동의 없이 재활용되고 있습니다.

[그 밖의 내용을 보려면 클릭하세요](https://www.youtube.com/embed/4v74j9-WOsQ)