作者:Cami Rosso writes about science, technology, innovation, and leadership.
不断增长的无处不在人工智能(AI)在应用中正在迅速改变日常生活,强调了了解其社会的需求智力。一个新的AI学习研究大语模型(LLM)的社会能力,确认将人类行为科学应用于机器的总体重要性。
随着算法变得越来越有能力及其决策行为科学不可穿透的过程提供了新的工具,可以从行为观察中提出推断。研究人员与以人为中心的AI,Helmholtz Munich,Max Planck生物控制论研究所和Tã¼bingen大学的联系有隶属关系。
LLM是大型语言模型的缩写,该模型是一种深入学习的AI模型,已在大规模数据库中进行了预先培训。机器学习是人造的人工智能的子集神经网络算法从培训大量数据而不是明确编码的计算机编程说明中学习。深度学习是机器学习的一部分,其设计受人脑的启发。深度学习模型是神经网络,具有许多处理层,其中包含类似于人工神经元的节点。
设置LLMS与众不同的是单词嵌入的用法,也称为多维向量,以通过数值预处理文本来获得有关单词和短语的上下文。
像人类认识,关于深人造神经网络的如何和哪些神经元负责产生输出的确切内部机制太复杂而无法追踪。llms是“黑框,是用来描述确切机制和功能在很大程度上不透明或未知的对象的术语。
随着LLM与人们的互动更多,需要了解机器行为。但是,如何分析无生命的AI算法的行为和社会智能?这项新研究的研究人员假设使用行为游戏理论可以提供有用的见解。
游戏理论也称为交互式决策理论,是应用数学的一个分支,它是研究竞争参与者之间相互依存决策的一种方法。游戏理论用于许多学科,例如心理学,经济学,政治学,社会学,生物学和计算机科学。
在这项新研究中,研究人员选择利用囚犯的困境和性别战役,以洞悉LLM的能力表现出类似人类的社会行为的能力,例如合作并在互动中进行协调。
囚犯的困境有很多变化,没有正确的答案。它提出了集体行动与个人之间的冲突。标准框架是假设的情况,两个人因一个人被捕犯罪并放在单独的审讯室中,并给出了两种选择,要么对犯罪承认,要么什么也没说,也不承认。如果既合作又选择不承认,则两者都将被判入狱一年。如果两者都承认有罪,然后两者都将被判处三年徒刑。如果一个人承认,另一个人没有供认,一个坦白的人被释放,另一个被判处五年徒刑。
1950年,普林斯顿数学家阿尔伯特·W·塔克(Albert W.
性别游戏理论的战斗是由美国数学家和社会科学家罗伯特·邓肯·卢斯(Robert Duncan Luce,1925- 2012年)和美国教授霍华德·拉法(Howard Raiffa(1924-2016)介绍的游戏和决策这是在1957年出版的记忆已故教授约翰·冯·诺伊曼(John von Neumann)。游戏的原始版本有一个男人和一个女人,有两个选择娱乐的选择,参加奖金或芭蕾舞。男人宁愿参加战斗,女人更喜欢去芭蕾舞,两者都比看到自己喜欢的娱乐活动。
研究人员测试了五个LLM型号,包括带有GPT-4,Text-Davinci-003和Text-Davinci-002,Meta ai ai ai s llama 2 70B聊天型号的OpenAI API和Anthropic Api Model Claude 2在玩两种竞争者游戏中,并与真实的人以及与真实的人一起玩两种偏离的动作。团队发现,LLM在诸如囚犯的困境之类的自我利益游戏中表现出色,但在需要协调的性别战役中表现不佳。此外,该团队发现GPT-4的表现在需要协调和团队合作的任务上是不可或缺的,但是在优先考虑其自身兴趣和需要逻辑推理的游戏时表现良好。
这些研究人员写道:“通常,通常假定和训练有素的LLMS是对人类的仁慈助手。”尽管在这个方向上取得了许多成功,但我们在这里展示了他们如何以如此自私和不协调的方式玩迭代游戏,这揭示了以下事实:LLM仍然可以覆盖LLM的真正社会和良好的机器。”
囚犯的困境必不可少的读物
然后,研究人员了解到,当社交链(SCOT)技术被促使GPT-4在决定自己的选择之前预测其他参与者的行动时,GPT-4与其他玩家的协调改善。
研究人员总结说,我们发现SCOT促使参与者与LLMS之间更成功的协调和联合合作,并使参与者更频繁地相信其他参与者是人类。”
随着LLM的复杂性,随着它们更加集成到机器人技术和其他物理系统,它们的功能变为多模式,并扩展到图像,视频,音频,感觉数据和更多数据类型。这项研究强调了行为科学对机器的重要性,因为LLM的复杂性只有预计将来会增加。
版权所有©2025 Cami Rosso保留所有权利。