作者:Jeremy Kahn
您好,欢迎来到 Eye on AI。在这篇时事通讯中——为什么一家合法的人工智能初创公司表明人工智能的繁荣不仅仅是基础模型;Zoox 开始在旧金山提供机器人出租车服务;越狱法学硕士驱动的机器人非常容易;基础模型进展是否已见顶?
上周有很多关于通用基础模型的进展是否可能会成为现实的讨论。撞墙以及这对人工智能的繁荣意味着什么。(有关此内容的更多信息,请参阅下面的“健脑食品”部分。)
一些怀疑论者,比如加里·马库斯,预测一场与互联网泡沫崩溃相当的清算。我将于明天在里斯本举行的网络峰会上讨论这个话题,并在当地时间下午 4:25 与 Moveworks 首席执行官 Bhavin Shah 和 AI Now 主持一场中心舞台对话,题为“AI 泡沫即将破裂吗?”研究所联合执行董事莎拉·迈尔斯·韦斯特 (Sarah Myers West)。您可以在网络峰会直播!
我的观点是,即使基础模型的进展正在减速,对于为特定行业实施人工智能应用的公司来说,这可能并不像 OpenAI 这样的公司那么重要,因为 OpenAI 的 1570 亿美元估值似乎主要取决于实现通用人工智能 (AGI)。或者至少它是基于这样一个场景:OpenAI 仍然处于模型开发的最前沿,并在其业务周围拥有某种防御性的护城河,如果建立更大的法学硕士不赋予这种能力,情况就不会是这样。显着的能力优势证明了成本的合理性。
许多人工智能应用公司的业务是销售针对特定行业问题的解决方案,而不是销售一种特定的人工智能模型或一些模糊的概念,例如“通用智能”。在许多情况下,这些解决方案不需要AGI——甚至必然是人工智能能力的任何进一步飞跃。在某些情况下,只需将多个现有模型耦合在一起,并根据与特定专业任务相关的数据对其进行微调,就可以创建一个相当不错的业务。
法律科技领域的一个很好的例子是罗宾艾。该公司由高伟绅律师事务所前律师 Richard Robinson 和帝国理工学院和伦敦国王学院前机器学习研究员 James Clough 于 2019 年创立。罗宾不仅仅向公司出售一项特定的技术。相反,它向大公司出售法律服务,其中一些服务是通过人工智能软件自动提供的,还有一些服务是由罗宾工资单上的人类律师和律师助理提供的,他们得到了包括人工智能在内的技术的协助,罗宾发达了。
“这是一种结合,既能完成模型当前能够完成的任务,又能对目前无法完成的任务进行投资,然后在循环中利用人类来弥合能力差距,”罗宾逊告诉我。
他承认“人们期望模型能做的事情和它们实际可靠地做的事情之间存在差距。”例如,他说,最先进的人工智能模型现在在总结方面表现出色,在翻译方面也相当出色。但他们还无法可靠地谈判一份复杂的法律文件,也无法准确地起草法庭案件的摘要。“他们可以完成部分任务,但无法完成全部任务,”他说。
但最重要的是,即使存在这些差距,Robin AI 仍拥有可行的业务。即使这些差距只是缓慢缩小,甚至可能永远不会缩小,它仍然拥有可行的业务。
这是因为,虽然有些客户只是从 Robin 购买软件,但其他客户则将整个法律任务外包给公司,而 Robin 则需要弄清楚如何以给定的价格最好地交付该任务。
“我们有员工,但他们利用我们的技术进行了高度优化,从而大大降低了成本,”罗宾逊说,并指出该公司不会通过在印度或印度等低成本国家雇用律师助理来进行劳动力套利。菲律宾。相反,它在纽约、伦敦和新加坡雇佣了律师和律师助理,但在 Robin 的法律副驾驶技术的帮助下,他们可以更快地工作。该技术不仅包含 OpenAI、Anthropic 和 Meta 等开发的基础模型,还包含一整套其他技术,包括搜索算法和老式硬编码规则,所有这些都链接在一起复杂的工作流程。
Eye on AI 报告称,该公司在最初 2600 万美元的 B 轮融资基础上,已经完成了 2500 万美元的“B Plus 轮”融资,这表明了对 Robin 前景的信心。一月份宣布。这使得 Robin AI 迄今为止筹集的总金额达到 6150 万美元。
新一轮融资的投资者包括 PayPal 的风险投资部门、亿万富翁迈克尔·布隆伯格 (Michael Bloomberg) 的家族办公室(名为 Willets)以及剑桥大学,它们都是 Robin AI 的客户。最初的 B 轮融资由淡马锡牵头。该公司没有透露最新投资后的估值。该公司表示,目前每年的经常性收入为 1000 万美元。
罗宾逊表示,该公司希望进行进一步的投资,尽管最初的 B 轮融资还剩下足够的资金,部分是为了向名为“报告”的产品添加额外的功能,该产品已被证明特别受客户欢迎。报告允许用户就一组文档提出无限的问题。它在底层使用 Anthropic 的克劳德模型来帮助增强其响应能力。罗宾逊表示,公司希望在报告功能的基础上增加更多的推理能力,但使用最先进的基础模型会增加公司的成本,这就是为什么在银行获得额外资金会有所帮助。
Robin AI 还与许多财力雄厚的竞争对手竞争,其中包括由 OpenAI 支持的 Harvey AI,去年夏天以 15 亿美元的估值筹集了 1 亿美元的资金。它还与汤森路透的产品竞争,汤森路透拥有 Westlaw,并收购了多家合法的人工智能初创公司,其中包括 2023 年以 6.5 亿美元收购的 Casetext。
Robin 表示,在最近的一个案例中,它帮助一家未透露姓名的美国生物技术公司处理数据泄露问题,审查了 30 种不同合同类型的 10,000 份合同,以了解该生物技术公司在向交易对手通知数据泄露事件方面的义务。Robin 表示,利用 Reports 产品以及 Robin 的人类法律专家,该生物技术公司能够在短短几小时内确定需要通知的 50 份最高优先级合同,并在 72 小时内为所有 10,000 份合同制定行动计划。据估计,这为生物技术公司节省了 93% 的时间,并节省了 80% 的费用,预计聘请外部律师事务所人工审查合同所需费用为 260 万美元。这就是当今公司从人工智能中获得的价值。即使 GPT-5 相对于 GPT-4 的进步不如 GPT-4 相对于 GPT-3 的进步那么大,它的价值也不会消失。
接下来是更多人工智能新闻。
杰里米·卡恩
jeremy.kahn@fortune.com
@jeremyakahn
**在我们收到消息之前:如果您想了解更多有关人工智能的未来发展以及您的公司如何从该技术中获得投资回报率的信息,请于 12 月 9 日至 10 日在旧金山与我会面。财富头脑风暴人工智能。我们将了解 Amazon Alexa 的未来罗希特·普拉萨德,公司高级副总裁兼通用人工智能首席科学家;我们将了解 Google 生成式人工智能搜索的未来莉兹·里德,谷歌搜索副总裁;以及人工智能的形态克里斯托弗·杨,微软业务开发、战略和风险投资执行副总裁;我们会听到前旧金山 49 人队球员的声音科林·卡佩尼克关于他的公司 Lumi 和 AI 对创作者经济的影响。您可以查看议程并申请参加这里。(记住,如果你编写代码卡恩20在注册页面的“其他评论”部分,您将获得 20% 的票价折扣,这是对忠实“Eye on AI”读者的丰厚奖励!)
机器人出租车公司 Zoox 在旧金山推出。该公司的自动驾驶出租车最初将仅向 Zoox 员工开放,并且仅在 SoMa、Zoox 等一个社区运营在博客文章中说。尽管如此,这仍然标志着 Zoox 继拉斯维加斯之后进入了第二个市场,该公司自 2023 年以来一直在拉斯维加斯的公共道路上进行自主运营,现在已将其业务扩展到拉斯维加斯大道。与一些竞争对手的自动驾驶汽车不同,Zoox 的机器人出租车缺乏手动控制。
Google DeepMind 和姊妹公司 Isomorphic 公开 AlphaFold 3 以供研究。两个 Alphabet 部门表示更新的博客文章他们在 GitHub 上向学术研究人员免费提供 AlphaFold 3 的模型权重和代码。该模型可以预测各类生物分子的结构和相互作用,包括蛋白质、DNA、RNA、配体等。它可以通过多种方式帮助研究人员。但 AlphaFold 3 许可条款不允许药物发现公司将该模型用于商业用途。
中国公司腾讯声称拥有最强大的开放权重人工智能模型称号。这家中国互联网巨头推出了混元大型号,并表示它在一系列基准测试中击败了 Meta 的 Llama 3.1 405B 型号。与 Meta 的模型一样,混元是一个“开放模型”,但并不是真正的开源模型,因为模型权重是公开的,但模型训练所用的数据却不是公开的。您可以在腾讯发表的一篇论文中阅读有关混元和基准测试结果的更多信息这里。
事实证明,越狱 LLM 驱动的机器人与越狱 LLM 驱动的聊天机器人一样容易。这也许并不令人惊讶,但却令人不安。研究人员发现,大型语言模型相对容易越狱——让人工智能系统越过护栏并提供不应该的输出,这可能是危险的(比如给某人制造炸弹的配方或告诉某人自我伤害)。但当法学硕士控制一个真正的机器人,该机器人可以在世界上采取行动并可能造成直接的身体伤害时,这种越狱就更加危险了。
宾夕法尼亚大学的研究人员开发了一款名为 RoboPAIR 的软件,旨在自动查找提示,以越狱法学硕士控制的机器人,并在三个不同的机器人系统上对其进行了测试。在每种情况下,RoboPAIR 在尝试几天内就克服了机器人护栏,取得了 100% 的成功率。该系统甚至可以对抗 Go2,这是一个代码未公开的机器人控制系统,这意味着 RoboPAIR 只能查看机器人对提示的响应,以获取有关如何发起攻击以突破其护栏的线索。您可以在 IEEE Spectrum 的故事中阅读有关该研究的更多信息这里。
人形机器人创作的艺术品在拍卖会上拍出100万美元的高价——克里斯·莫里斯
您认为唐纳德·特朗普的人工智能政策计划是可以预测的吗?准备好感到惊讶吧——莎朗·戈德曼
Duolingo 的新型翻白眼情绪聊天机器人 Lily 在投资者电话会议上短暂替换了首席执行官,以展示其人工智能技术— 克里斯蒂安·赫兹纳 (Christiaan Hetzner)
11 月 19 日至 22 日:微软点燃,芝加哥
11 月 20 日:大脑谷人工智能峰会,旧金山
11 月 21 日至 22 日: 全球人工智能安全峰会,旧金山
12 月 2 日至 6 日:AWS re:Invent,拉斯维加斯
12 月 8 日至 12 日: 神经信息处理系统 (Neurips) 2024,温哥华,不列颠哥伦比亚省
12 月 9 日至 10 日: 《财富》头脑风暴 AI,旧金山(注册这里)
12 月 10 日至 15 日:NeurlPS,温哥华
1 月 7 日至 10 日:国际消费电子展,拉斯维加斯
人工智能的缩放法则是否被打破了?早在 2020 年,OpenAI 的研究人员就认为法学硕士遵循他们所谓的比例定律– 采用相同的基本模型设计,但使模型更大并在更多数据上进行训练将导致性能与模型大小和数据的增加成正比。OpenAI 研究人员称这些比例定律是因为他们想要唤起物理定律(不可阻挡的真理),但它们只不过是对目前似乎有效的观察结果。现在,越来越多的证据表明,他们不再坚持认为,模型规模和数据的增加可能会在某一点之后产生收益递减。
OpenAI 发现,其最新的 AI 模型(代号 Orion)本应是 GPT-4 模型的后继者,尽管规模更大且接受了更多数据的训练,但在一些关键指标上未能击败 GPT-4。一份重磅报告来自信息援引未透露姓名的公司员工的话。特别是,与 GPT-4o 相比,Orion 在编码等任务方面的技能并没有得到提高,甚至可能还更差。
因此,据该出版物报道,OpenAI 不得不依靠其他技术来提高 Orion 的性能。这可能包括在初始训练后对模型进行更多微调,以及将基本 Orion 模型与更类似于 OpenAI 的 o1“Strawberry”模型的系统合并,该模型经过强化学习训练以使用搜索过程跨越多种可能的反应途径,以“推理”方式获得更好的答案。
这对整个人工智能热潮意味着什么?目前还不清楚,但这肯定会让 OpenAI 的 AGI 之路以及其他现在表示正在追求这一目标的公司(从 Google DeepMind 到 Meta 再到亚马逊)的道路看起来更加困难。不过好消息是,这一挫折可能意味着公司将更加认真地考虑其他学习效率更高的人工智能架构和算法——使用更少的数据、更少的计算机硬件和更少的能源。这对世界来说应该是件好事,即使对 OpenAI 来说可能不是好消息。
这是《财富》杂志关于人工智能如何塑造商业未来的每周通讯《Eye on AI》的在线版本。免费注册。