探索AI数据领域的全新前景

随着时间的推移,曾经在2000年代初成为领先图像托管站点的Photobucket看到用户数量的显著下降。然而,公司现在可能会通过探索许可其拥有的130亿张照片和视频用于生成AI模型训练而找到新生机。

首席执行官泰德·莱昂纳德透露,Photobucket目前正在与多家科技公司就许可其大量内容展开谈判。生成AI模型依赖于大型数据集来学习,并根据文本提示生成新内容。讨论中的潜在交易范围从每张照片5美分到1美元,每段视频超过1美元不等,价格根据买家的要求而定。

虽然Photobucket未透露潜在买家的身份,原因是商业机密,但这些谈判揭示了围绕生成AI技术的新兴数据市场。像谷歌、Meta和微软支持的OpenAI等科技巨头最初依赖于免费从互联网上获取数据来训练他们的AI模型。然而,他们现在发现自己在探索付费替代方案,包括许可那些锁定在付费墙和登录页面后的内容。

Klaris Law律师事务所表示,他们一直在为内容所有者进行价值数千万美元的许可交易提供建议,使公司能够许可照片、电影和书籍档案以供AI训练使用。这种隐藏的数据交易引起了人们对个人数据在未经个人知情或明示同意的情况下用于AI模型的担忧,促使围绕数据隐私和伦理展开讨论。

AI数据市场尚未得到广泛研究,但估计表明目前价值约为250亿美元,并可能在未来十年内增长到近300亿美元。随着生成AI模型需求的增加,公司正在寻求确保其数据供应链的安全。他们正在与内容所有者签订协议,例如Shutterstock等存储库提供商,以获取他们庞大的图像、视频和音频文件存档。

除了Shutterstock等既定参与者外,较小的科技公司也正在达成类似的许可协议,以确保为AI训练获取必要数据。这一趋势导致了致力于获取内容的AI数据公司的兴起,无论是通过许可协议还是通过短期合同工人的帮助进行定制生产。

随着AI行业的发展,“合法获取的”内容的关注变得至关重要。在公司进行复杂数据交易的同时,他们还必须解决与版权侵权和隐私侵犯有关的问题。AI数据市场的增长为内容所有者提供了将其收藏品变现的机会,但也突显了增加透明度和保护个人数据权利的必要性。

常见问题解答

1. 什么是生成AI?
生成AI是人工智能的一个分支,利用大量数据集学习并根据文本提示生成新内容。它依靠训练模型来理解模式并生成独特的输出。

2. Photobucket计划如何利用其内容进行生成AI训练?
Photobucket正在与科技公司就许可其大量照片和视频进行谈判。这些资产将用于训练生成AI模型,使其能够基于文本提示生成新内容。

3. 关于个人数据在AI模型中使用的担忧是什么?
未经明示同意而将个人数据用于AI模型引发隐私担忧。有必要确保个人数据的合法获取和使用,同时建立适当的保障措施以保护个人权利。

4. AI数据市场规模是多大?
AI数据市场仍处于新兴阶段,其确切规模很难估算。但一些研究人员表示,它目前价值约为250亿美元,并预计未来十年内可能增长到近300亿美元。

5. 公司如何确保其用于AI训练的数据供应链安全?
公司正在与内容所有者签订许可协议,以获取他们的图像、视频和其他相关数据存档。此外,AI数据公司的出现有助于获取内容并确保数据的合法使用。

资料来源:
– 路透社

The source of the article is from the blog elektrischnederland.nl

Privacy policy
Contact