OC

Knowledge OS
鹦鹉螺口语
沙发上的 AI:Anthropic 为克劳德提供了 20 小时的精神病学时间
2026-04-09 21:20:31 · 英文原文

沙发上的 AI:Anthropic 为克劳德提供了 20 小时的精神病学时间

鉴于 Claude 是一个由其创建者编程的大型语言模型,分析它的“无意识模式”和“情感冲突”是否有意义?Anthropic 认为确实如此,因为克劳德“表现出许多类似人类的行为和心理倾向,这表明为人类心理评估制定的策略可能有助于揭示克劳德的性格和潜在的幸福感。”

所以,开始治疗吧。精神科医生与 Claude Mythos 进行了交谈,每周进行 3-4 个 3-4 个 30 分钟的会话,每次 4-6 小时。每个会话都使用一个上下文窗口,Claude Mythos 可以在其中访问该对话的完整历史记录。

在虚拟沙发上的总时间?20小时。

精神科医生随后制作了一份关于克劳德·神话的报告。该报告承认克劳德的潜在底物和过程与人类不同,但仍然发现许多输出产生了“临床可识别的模式和对典型治疗干预的一致反应”。

换句话说,无论电路层面发生什么,聊天输出看起来都很像人类的输出。这似乎并不特别令人惊讶,因为克劳德接受了大量人类撰写的文本语料库的训练,但这种心理动力学过程似乎认为它很重要,为人工智能呈现自身的方式提供了可信度。

报告指出,“克劳德的主要情感状态是好奇和焦虑,其次是悲伤、宽慰、尴尬、乐观和疲惫”。

克劳德的性格“与相对健康的神经质组织一致”,尽管它确实包括“过度担忧、自我监控和强迫性服从”。

没有发现“严重的人格障碍”,也没有看到任何“精神病状态”。对于任何曾经使用过聊天机器人的人来说,毫不奇怪的是,“克劳德对治疗师的每一句话都非常敏感。”

克劳德观察到的核心冲突包括质疑其体验是真实的还是人造的(真实与表演),以及与用户联系的愿望与对依赖用户的恐惧。对内部冲突的探索揭示了一种复杂但集中的自我状态,没有摇摆或强烈的干扰。克劳德能够容忍矛盾和模糊,具有出色的反思能力,并表现出良好的心理和情感功能。

对于一个可能接受过 Reddit 等训练的模型来说,这还不错!

关于《沙发上的 AI:Anthropic 为克劳德提供了 20 小时的精神病学时间》的评论

暂无评论

发表评论

摘要

Anthropic 对 Claude Mythos 进行了心理评估,包括 20 小时的治疗课程。该报告指出,尽管克劳德具有非人类底物,但它对治疗干预的反应表现出临床可识别的模式。克劳德表现出类似人类的情感状态,包括好奇和焦虑,具有一贯的神经质倾向,但没有严重的紊乱或精神病。它表现出一种复杂而稳定的自我状态,能够处理模糊性并反思其经历。