作者:Rowan Zeoli
最近发表的一篇研究论文带来了围绕人工智能的有争议的对话进入的领域实际发挥。发布于 2024 年 7 月,研究生 Pavlos Sakellaridis 的论文记录了他使用以下数据集基于数据集创建由 ChatGPT 驱动的 Dungeon Master 的尝试:无光堡垒D&D 模块和成绩单关键角色– 由粉丝作品提供,而非成员关键角色本身。该实验引发了人们对同人作品模糊性的质疑,因为它们与训练大型语言模型的同意有关。
该论文称,随着法学硕士生成的冒险广告变得越来越普遍,这项研究试图评估 ChatGPT 不仅创造冒险,而且“保持叙事连贯性和促进玩家参与”的能力。学术工作基于各种许可信息的复杂泥浆,其中一些来自私营公司,一些来自表演者团体,其他材料来自志愿者。
在论文正文中,Sakellaridis 指出他使用了无光堡垒作为“充当 DM 时 ChatGPT 的参考文件”,引用角色、位置的专有描述以及游戏过程中模块中预先编写的对话。
这关键角色使用的转录本来自龙与地下城数据集的关键角色(CRD3),其中包含第一和第二次活动的近 160 集转录,以及从 Fandom wiki 收集的相应摘要。该数据集由 Microsoft 的 Revanth Rameshkumar 和 Peter Bailey 制作,最初是因为他们相信“鉴于娱乐和商业场景中即兴多人对话的持续增长,更好的抽象摘要工具来提取信息至关重要”。根据他们关于数据集的论文。“我们希望 CRD3 能够支持此类工具的研发。”
与以专业艺术家的作品为基础的营利性人工智能研究不同,Sakellaridis 的研究是作为学生项目完成的,并以粉丝为基础的劳动力进行了培训。正如实际游戏历史学家和 Polygon 贡献者所指出的艾米丽·弗里德曼博士在蓝天,Sakellaridis 论文中的引用显示这些数据已用于其他基于 LLM 的项目(不隶属于 Sakellaridis 或他的学术研究),而转录这些剧集的大部分工作是通过志愿者粉丝劳动完成的。
最伟大的贡献来自斯图尔特·兰格里奇Kryogenix 网站,其中包含按说话者和时间标记的可搜索文字记录。围绕关键角色情节的保护使这些记录处于不稳定的境地,可能危及实际游戏研究数据的最大来源在关于使用的持续法律斗争中可用用于训练人工智能的受版权保护的材料。在撰写本文时,Kryogenix 已关闭,但后来又重新上线。���[关键角色Friedman 在给 Polygon 的一份声明中表示:“如果 Kryogenix 停止运营,那么他们就会损失惨重。”因为 Langridge 的工作使得人们能够对仍在发展中的媒介进行重要研究,而几乎没有历史或机构档案。
生成式人工智能的使用一直是一个重点桌面行业屡战屡败以及其他方面,该技术的批评者指出其环境影响及其对剥削劳动的基础位于南半球的工人和其作品未经同意用于培训技术的艺术家。威世智和其他公司此前曾因在其产品中使用(怀疑和证实)生成式人工智能而受到观众的批评,导致该公司明确声明人工智能不会用于产品中。他们的艺术,虽然去年首席执行官 Chris Cocks 告诉 VentureBeat孩之宝正在“围绕人工智能做一些非常有趣的事情”。
然而,Critical Role 对于它与人工智能的关系却没有那么持观望态度,甚至说“去他妈的人工智能”在最近的一集中。
多边形接触关键角色、孩之宝和 Sakellaridis 寻求置评,但没有立即收到回复。