人工智能数据淘金热中的同意案例
2025-01-16 20:11:02
在文本和数据挖掘(TDM)背景下如何平衡内容创作者(例如出版商)和人工智能公司的利益问题是复杂且多方面的。当前争论的焦点是在确定 TDM 许可时是否采用选择加入或选择退出的方法,这对版权法和数字版权管理具有重大影响。### 要点:1. **版权和默认假设**:- 传统上,版权在默认的“选择加入”基础上运作:内容创建者保留对其作品的完全控制权,除非他们明确允许其他人使用它。- 欧盟版权指令 (2019) 引入了科学研究环境中 TDM 的选择退出方法。这一转变引起了权利持有者的担忧,担心他们执行限制的能力受到削弱。2. **Robots.txt 和现代化**:- Robots.txt 是一个标准,历来允许网站管理员控制机器人(例如爬虫和蜘蛛)对其网站的访问。- 随着人工智能的出现,需要更新此协议以处理更细粒度的 TDM 权限。这包括嵌入许可信息和跟踪使用情况。3. **选择加入与选择退出**:- **选择加入**:在 TDM 中使用内容之前需要获得权利所有者的明确许可。- 符合传统的版权原则,确保创作者保留对其作品的控制权。- 对于人工智能公司来说可能会更加繁重,因为它们可能需要根据每个内容协商权限。- **选择退出**:假设已授予许可,除非权利持有者明确限制。- 人工智能公司更容易大规模实施,但引发了对侵犯创作者权利的担忧。4. **标准化工作**:- 互联网工程任务组 (IETF) 和万维网联盟 (W3C) 等组织正在制定新标准,以促进对 TDM 进行更精细的控制。- 建议包括将许可信息直接嵌入数字文件中,从而允许更细致的权限。5. **经济影响**:- 人工智能公司在模型开发上投入巨资,而没有与内容许可相关的大量成本(估计占人工智能开发总预算的 0.1% 左右)。- 这引发了人们对依赖免费数据源的可持续性和公平性的质疑,特别是当这些公司实现了巨大的估值时。### 建议:- **立法行动**:政策制定者应考虑制定与传统版权原则(默认选择加入)更紧密结合的法律,同时为细化权限提供灵活性。- **技术标准**:鼓励制定支持选择加入机制的技术标准,并促进权利持有者和人工智能公司之间轻松协商许可。- **公众参与**:确保对此问题的讨论具有包容性,涉及不同利益相关者(包括互联网用户和小型出版商)的观点。### 结论:TDM 向选择退出方法的转变可能会破坏版权法的基本原则。虽然它可能会简化人工智能公司的实施,但它给依赖知识产权的内容创作者带来了不成比例的负担。尊重双方权利的平衡方法对于促进创新、同时保护那些推动这些进步的人的利益至关重要。通过将技术标准和法律框架与选择加入的默认设置保持一致,我们可以确保人工智能开发的利益得到更公平的分配,并维护数字版权管理系统的完整性。