道德危机：儿童图像被滥用用于培训人工智能系统

人权观察警告称，人工智能未经儿童同意使用其图像令人担忧

在一项惊人的揭示中，人权观察（HRW）将关注焦点放在人工智能训练实践中的一种令人担忧的趋势上。他们的报告集中关注了从巴西儿童的个人照片，这些照片已经被从互联网收集并用于开发人工智能而未经父母授权。

HRW的研究人员对从儿童照片在人工智能训练数据集中的滥用可能对儿童造成的伤害表示担忧。急需巴西政府采取干预措施，以防止此类滥用并保护未成年人的数据权利。

一切起源于对数据语料库LAION-5B的审查，这是一个用于AI训练的庞大数据集，通过对在线内容进行大规模自动化收集而编制而成。其中包含着可识别的巴西儿童照片，有时他们的姓名明显标记在说明或图片URL中。这种轻松获取照片的方式，再加上展示其真实身份的额外细节，如时间和地点，构成了HRW强调的隐私侵入行为。

尽管这些图像来自通常会阻止数据抓取机器人的博客和照片分享网站，但这些图像却成功地进入了LAION-5B。该数据集中的照片可追溯几十年前，这引发了对隐私法律和意识的重要疑虑，自这些照片最初发布以来，这些法律和意识已经发生了变化。

在涵盖接近60亿照片和说明的LAION-5B的仅一小部分范围内，HRW的调查揭露了来自巴西各地的170张照片。编制该数据集的非营利组织LAION已经承认存在私人儿童照片，并承诺删除HRW确定的这些照片。

对于AI工具可能复制和滥用这些图像的担忧是切实可感的。改变了背景可能导致艺术家剽窃或生成有害内容，例如儿童的deepfake视频或淫秽内容。斯坦福大学的研究人员此前曾经在LAION-5B中揭示了这些风险，包括可能产生冒犯性内容的潜力。

这一问题引发了关于数据保护和监护人及内容托管者控制其数字足迹以有效保护隐私的责任的基本问题。

主要问题与答案：

– 未经同意使用儿童图像对人工智能训练的伦理意义是什么？ 未经父母同意使用儿童图像产生了一系列伦理困境。它侵犯了隐私权，可能使儿童面临身份盗窃、跟踪或在不利环境中的滥用，如deepfake视频、欺凌或其他形式的剥剥削。

– 存在哪些法律框架来保护个人数字数据权利？ 欧盟的《通用数据保护条例》（GDPR）和美国的《儿童在线隐私保护法》（COPPA）等法律框架旨在保护个人的个人数据，并为数据同意和隐私建立规则，尤其是针对未成年人。

– 组织在创造伦理人工智能数据集时面临哪些挑战？ 主要挑战之一是确保用于训练人工智能的数据来源具备道德和法律依据，并且获得适当的同意。还需要过滤敏感内容并防止数据集中可能导致歧视或不平等的偏见。

主要挑战或争议：

– 数据抓取： 无意中收集并使用儿童个人图像的数据抓取方法是有争议的，因为这往往是在数据主体不知情或未经同意的情况下发生，导致隐私侵犯。

– 数据集策展： AI研究人员和公司负责负责地对数据集进行策展是一个重要挑战。识别并删除敏感内容，尤其是涉及未成年人的内容，是必不可少的，但由于数据量庞大，这可能会很困难。

– 法律和管辖问题： 不同国家有不同的隐私和数据保护法律。这为全球AI发展创造了复杂的法律环境，在这种环境中，跨国数据集可能会与当地的隐私规定发生冲突。

优点与缺点：

– 优点： 使用多样化数据训练AI系统可以产生更准确和高效的技术，对社会有益。它可以为医学诊断、教育和安全等领域的进步做出贡献。

– 缺点： 滥用个人图像，尤其是儿童图像，可能会带来法律和道德后果。它会破坏公众对AI和技术提供者的信任，并在违反隐私时损害个人。

如需进一步了解如何保护数字数据权利和伦理人工智能实践，您可以访问以下组织链接：

– 人权观察： www.hrw.org
– LAION（大规模人工智能开放网络）： www.laion.ai（请注意，有关伦理问题的特定页面可能不在主域上）

请确保在访问之前验证URL，因为域的结构可能会随时间而变化。