2024 年 11 月 14 日Ø
过去一周,来自大型人工智能实验室内部人士的一些报道称,构建超级智能的竞赛正在陷入困境。
具体来说,他们表示,将行业从 OpenAI 的第一个大型语言模型带到我们今天拥有的法学硕士的方法已经开始显示出回报递减。
今天,让我们看看所有参与者都在说什么,并考虑一下这对人工智能军备竞赛意味着什么。虽然有报道称人工智能缩放定律在技术上似乎是准确的,但它们也很容易被误读。无论好坏,更强大的人工智能系统的开发似乎都在继续加速。
缩放定律当然,它们并不是“自然法则”意义上的法则。相反,它们与摩尔定律一样,包含观察和预测。我们观察到,随着模型大小、输入模型进行训练和测试的数据量以及完成训练运行所需的计算资源的增加,LLM 会得到改善。
这些法律首次记录在 OpenAI 于 2020 年发表的一篇论文中,它对人工智能工作人员(以及相关文章的撰写者)的想象力有着强大的影响力。如果这些定律在接下来的几代更大的模型中继续适用,那么大型人工智能公司之一确实可能创造出像超级智能这样的东西,这似乎是合理的。另一方面,如果它们开始崩溃,这些公司可能会面临更加艰巨的任务。追求缩放法则的成本极其高昂,但技术上却很容易理解。如果他们犹豫不决,人工智能军备竞赛的获胜者可能不再是花钱最多、速度最快的公司。
上星期,信息报道称,OpenAI 可能已经开始触及这样的极限。这里有斯蒂芬妮·帕拉佐洛、艾琳·吴和阿米尔·埃弗拉蒂:
今年 5 月,OpenAI 首席执行官 Sam Altman 告诉员工,他预计该初创公司研究人员正在培训的 Orion 可能会比一年前发布的上一个旗舰型号好得多。[...]一些 OpenAI 员工表示,虽然 Orion 的性能最终超过了之前的型号,但与该公司最后发布的两款旗舰型号 GPT-3 和 GPT-4 之间的跳跃相比,质量的提升要小得多。使用或测试的 Orion。
据员工称,该公司的一些研究人员认为 Orion 在处理某些任务方面并不比其前身可靠。一位 OpenAI 员工表示,Orion 在语言任务上表现更好,但在编码等任务上可能无法超越以前的模型。
路透社本周火上浇油,引用了 OpenAI 联合创始人 Ilya Sutskever 的话,他于今年早些时候离开并创建了自己的人工智能实验室,这似乎证实了缩放法则已达到极限的观点。这里有胡晓明和佟安娜:
AI 实验室 Safe Superintelligence (SSI) 和 OpenAI 的联合创始人 Ilya Sutskever 最近告诉路透社,这是扩大预训练的结果,即训练 AI 模型的阶段,该模型使用大量未标记的数据来理解语言模式和结构 – 已趋于稳定。[...]– 2010 年代是扩展的时代,现在我们再次回到了奇迹和发现的时代。每个人都在寻找下一个目标,”Sutskever 说道。“扩大正确的规模现在比以往任何时候都更加重要。”
最后,彭博社周三证实 OpenAI 的 Orion 表现不及预期,并表示谷歌和 Anthropic 也遇到了类似的困难。这里有雷切尔·梅斯、希琳·加法里、迪娜·巴斯和朱莉娅·洛芙:
据三位知情人士透露,谷歌即将推出的 Gemini 软件迭代版并未达到内部预期。与此同时,Anthropic 看到其期待已久的 Claude 型号 3.5 Opus 的发布时间表有所推迟。
II.
那么发生了什么?专家们提出了几种理论来解释为什么新模型的性能没有达到制造商的预期。
一是人工智能公司正在耗尽高质量的新数据集来输入他们的模型。至此,他们已经成功地获得了网络上所有容易实现的目标。直到最近,OpenAI、Meta 和其他公司才开始付费从出版商和其他来源获取高质量数据的许可。用合成数据(人工智能实验室自己制作的数据)来掩盖这一缺陷的努力尚未取得突破。
另一种可能更麻烦的解释是,仅靠法学硕士无法构建超级智能。人工智能的进步主要通过这些模型达到各种基准的能力来衡量。虽然法学硕士已经以惊人的速度打破基准, 这基准可以被玩弄。更重要的是,模型无法理解因果关系以及其他需要多步骤推理的任务。他们经常犯事实错误并且缺乏现实世界的知识。
正如泰勒·考恩 (Tyler Cowen) 所写,也许是这个问题边际革命今天,我们对“知识”的看法过于狭隘对法学硕士寄予了不可能的期望。
“知识是关于系统的不同部分如何组合在一起的,而不是简单地以线性尺度表达的同源度量,”他写道。– 没有清晰的方法可以单独评估系统中任何单个单元的智能。此外,还有许多“墙”,这意味着即使在最好的情况下,知识也是崎岖不平的。因此,断言一个实体比以前“聪明三倍”是没有意义的。
如果你是那种关心人工智能快速发展的人,这似乎是个好消息。通往超级智能之路上的障碍意味着需要更多的时间来使系统符合人类价值观并防止它们造成伤害。它让社会适应人工智能已经深刻影响我们的方式,从教育到出版再到政治。它让我们呼吸。
但这可能只是一种一厢情愿的想法。
三.
—没有墙, – Sam Altman 今天在 X 上发帖。
今年奥特曼越来越喜欢这种精辟的说法,因为他用他的花园照片来预告即将发布的版本并向他的追随者提供其他复活节彩蛋。
OpenAI 拒绝对上述报道发表评论,但 Altman 似乎否认了这些报道,或者即使不否认他们的个人主张,至少也否认了其影响。他似乎是在说,OpenAI 不会因缩放定律的任何放缓而受到阻碍。确实,信息报道称,该公司最近的重点是以推理为中心的o1模型代表了该公司试图再次加速进步的一种方式。
路透社在报道中引用了 OpenAI 研究员 Noam Brown 的话,他曾在 o1 工作,上个月在旧金山举行的 TED AI 会议上表示。o1 模型使用一种称为“测试时间计算”的技术,该技术可以有效地为模型在推理时提供更多时间和计算。(在 ChatGPT 术语中,推理是您在查询中按 Enter 的那一刻。)
布朗认为,测试时间计算的影响可能是非凡的。
“事实证明,让机器人在扑克牌中思考 20 秒,与将模型扩大 100,000 倍并训练时间延长 100,000 倍具有相同的提升效果,”他在 TED AI 上说道。
因此,难怪人工智能首席执行官似乎相对不受缩放法则放缓的影响。Anthropic 首席执行官达里奥·阿莫迪 (Dario Amodei) 本周出现在莱克斯·弗里德曼 (Lex Fridman) 的播客上,并且也提出了类似的乐观看法。一个
“除了归纳推理,我们什么也没有告诉我们,未来两年将会像过去 10 年一样,”Amodei 说,他在 OpenAI 期间与人合着了第一篇关于缩放定律的论文。“但是我已经看过这部电影足够多的次数了,我已经看过这个故事发生足够多的次数了,我真的相信缩放比例可能会继续下去,而且它有一些我们还没有的魔力”“尚未在理论基础上得到真正的解释。”
当然,有一些自私的理由来提倡缩放定律完好无损的想法。(据报道,人择目前筹集数十亿美元.)但 Anthropic 并不夸张,并且比一些同行更重视人工智能安全。如果人工智能的进步正在放缓,我怀疑公司的许多人实际上可能会松一口气 - 并且会这么说。
最终,在人工智能实验室将下一代模型交到我们手中之前,我们将无法评估它们。周四,谷歌 Gemini 模型的实验性新版本让一些人感到惊讶立即跃居备受关注的人工智能排行榜榜首,将其置于 ChatGPT 4o 之前。在 X 上的一篇帖子中,首席执行官 Sundar Pichai 提供了向上和向右的股票图表表情符号。“未来还会有更多”他说。
实现超级智能确实可能需要单靠缩放定律无法提供的突破。但通往终点线的路径可能不止一条。这意味着,除其他外,我们不应该忽视如果我们到达那里它实际上意味着什么。
人工智能的其他进展:
- 据报道,OpenAI 正准备推出一款代号为“Operator”的 AI 代理,可以完成编写代码和预订旅行等任务。(希林·加法里和雷切尔·梅茨/彭博社)
- 适用于 macOS 的 ChatGPT 桌面应用程序现在可以读取 Mac 上某些编码应用程序的代码,例如 VS Code 和 Terminal。(麦克斯韦·泽夫 /TechCrunch)
- 适用于 iPhone 的 Gemini AI 应用程序现已推出。(大卫·皮尔斯 /边缘)
在本周的播客上:凯文和我讨论了将于 1 月份召开的令人惊讶的支持加密货币的国会的影响。然后,ChatGPT 产品负责人 Nick Turley 与我们一起讨论聊天机器人的前两年。最后,我们回答了听众关于他们今天应该使用什么社交网络的问题。
治理
- 看看埃隆·马斯克对特朗普过渡努力和海湖庄园的实际影响。它……相当广泛。(西奥多·施莱弗 /纽约时报)
- 看看专家们认为特朗普新任期内的网络安全会是什么样子——放松了有关企业和人权的规则,但加强了针对外国对手的战线。(埃里克·盖勒/有线)
- 据报道,美国司法部正在调查博彩平台 Polymarket,指控其接受美国用户的交易,并扣押了首席执行官 Shayne Coplan 的手机和电子产品。(迈尔斯·米勒和莉迪亚·贝尤德/彭博社)
- 选举后的第二天,X 的用户数量出现了最大的下降(自马斯克收购以来),许多人转向了 Bluesky 和 Threads。(凯特·滕巴奇和凯文·科利尔 / NBC 新闻)
- 据报道,高管们计划再次在 X 上做广告,以讨好特朗普新政府。????(汉娜·墨菲、丹尼尔·托马斯和埃里克·普拉特/金融时报)
- 讽刺刊物洋葱表示赢得了破产拍卖购买信息战,阴谋论者亚历克斯·琼斯用来散布有关桑迪胡克枪击事件的虚假信息的网站。年度最佳媒体故事,但还不是特别接近。(本杰明·穆林和伊丽莎白·威廉姆森/纽约时报)
- OpenAI 敦促美国与其包括中东国家在内的盟友合作,制定所谓的“北美人工智能契约”,开发人工智能系统并与中国竞争。(杰基·达瓦洛斯/彭博社)
- 法官裁定,Meta 必须面临 FTC 诉讼,指控其收购 Instagram 和 WhatsApp 是为了压制社交媒体竞争。(乔迪戈多伊/路透社)
- Meta 表示,为了遵守法规,它将在欧盟将 Facebook 和 Instagram 的无广告订阅价格降低 40%(乔纳森·瓦尼安 / CNBC)
- Meta 因通过将其 Facebook Marketplace 服务与社交网络捆绑在一起而对其他提供商施加不公平的交易条件而被罚款近 8 亿欧元。欧洲真的这些天Meta已经出来了。(哈维尔·埃斯皮诺萨 /金融时报)
- 据报道,消费者金融保护局正在寻求将谷歌置于联邦监管之下,这将使这家搜索巨头接受定期检查。(托尼·罗姆/华盛顿邮报)
- 据报道,亚马逊高管被召集与众议院一个重要委员会举行会议,回答有关尽管禁令迫在眉睫但仍与 TikTok 保持购物合作关系的问题。另一方面,如今这项禁令实际上有多大?(亚历山德拉·S·莱文/彭博社)
- FBI 和 CISA 表示,中国黑客在访问多家美国宽带提供商后窃取了“有限数量”政府官员的“私人通信”。(塞尔吉乌·加特兰 /电脑发出蜂鸣声)
- 苹果正面临英国消费者权益组织 Which? 发起的价值 38 亿美元的反垄断诉讼。涉嫌锁定人们以“敲诈”价格购买 iCloud。我很抱歉但是哪个???(娜塔莎洛马斯/TechCrunch)
- 谷歌正在测试从搜索中删除欧盟出版商的新闻文章,谷歌称这是因为监管机构“要求提供有关搜索中新闻内容影响的更多数据。”(艾玛·罗斯 /边缘)
- 谷歌表示,由于新的透明度法规存在不确定性,谷歌将停止向欧盟用户提供政治广告。(杰西韦瑟贝德/边缘)
- 欧盟人工智能法案的实践准则初稿涉及版权、系统性风险和透明度要求。(娜塔莎洛马斯/TechCrunch)
- 意大利间谍软件市场的发展概况。(苏珊娜·斯莫利/记录)
- 澳大利亚新的数字谨慎责任法将要求社交媒体公司采取积极主动的措施,解决用户(尤其是儿童)的在线心理健康风险。(妮可赫加蒂/澳大利亚广播公司)
行业
- 看看竞争对手发现马斯克为 xAI 建造超级计算机的速度有多快后,随之而来的混乱。(安妮莎·加迪齐 /信息)
- 据报道,X 任命流媒体平台 Tubi 前首席财务官 Mahmoud Reza Banki 为其新首席财务官。(亚历克斯·科西娅和贝基·彼得森/华尔街日报)
- 马克·扎克伯格 (Mark Zuckerberg) 与 T-Pain 合作翻唱了《Get Low》,献给他的妻子。他们称自己为 Z-Pain。(艾玛·罗斯 /边缘)
- 据报道,Meta 计划于 2025 年 1 月在 Threads 上推出广告。(Sylvia Varnham OâRegan 和 Kalley Huang /信息)
- Instagram 负责人 Adam Mosseri 表示,Threads 本月新增了 1500 万用户。(杰·彼得斯 /边缘)
- YouTube 正在测试类似 TikTok 的 Feed,当您滚动到当前正在观看的视频下方时,该 Feed 会显示无尽的视频。(大卫·皮尔斯 /边缘)
- 它还正在测试一项功能,允许创作者通过改变歌曲中的情绪或流派等元素,在短片中使用授权歌曲。(艾玛·罗斯 /边缘)
- YouTube 用户很快就可以购买“珠宝”来兑换礼物,以将符合条件的创作者送入 YouTube 合作伙伴计划。(奥马尔·沙基尔 /边缘)
- 谷歌 DeepMind 发布了 AlphaFold 3 的源代码和模型权重,它可以模拟蛋白质和其他分子之间的复杂相互作用。(迈克尔·努涅斯 /创业节拍)
- 人工智能先驱、法国开发人员弗朗索瓦·乔莱 (François Chollet) 在工作近十年后离开谷歌。(凯尔·威格斯/TechCrunch)
- 谷歌正在为 Pixel 设备上的电话推出实时诈骗检测功能,该功能将侦听“通常与诈骗相关的模式”并发送视觉警告。(李阿布纳/朝九晚五谷歌)
- 谷歌地图用户现在可以在附近的商店搜索家居用品和服装等商品。(杰西韦瑟贝德/边缘)
- 据报道,亚马逊正在使残疾员工获得在家工作许可的过程变得更加困难,建立了严格且有时是侵入性的审查流程。(斯宾塞·索珀/彭博社)
- Apple 发布了适用于 Mac 和 iPad 的 Final Cut Pro 更新,包括实时绘图和更新的相机应用程序等功能。(约翰·沃里斯 /麦克故事)
- Spotify 将根据付费订阅者对视频的参与度,开始向视频创作者和播客主持人付费。(亚历克斯·希思 /边缘)
- 此举似乎旨在重新赢得转向 YouTube 观看视频播客的观众。(安妮·斯蒂尔/华尔街日报)
- 与 Spotify 联合总裁、首席技术官兼首席产品官 Gustav Söderström 就该公司的生成式 AI 计划进行问答。(亚历克斯·坎特罗维茨/大科技)
- 家长很快就可以在家庭中心的 Snap 上请求孩子的位置,并更轻松地查看孩子正在与谁共享他们的位置。(昆汀·肯内默 /边缘)
- 该公司表示,人工智能搜索引擎 Perplexity 将于本周开始在其平台上测试广告。(凯尔·威格斯/TechCrunch)
- Openvibe 是一款多网络应用程序,允许用户同时发布到三个 X 替代方案——Mastodon、Bluesky 和 Threads——。(哈里·麦克拉肯 /快公司)
- 华尔街日报正在测试人工智能生成的文章摘要,该摘要显示为新闻报道顶部的“要点”框。(杰·彼得斯 /边缘)
- 看看艺术界如何从人工智能中汲取灵感来探索道德问题及其风险。(艾琳·格里菲斯/纽约时报)
那些好帖子
每天有更多好帖子,关注 Casey 的 Instagram 故事。
(关联)
(关联)
(关联)
与我们交谈
向我们发送提示、评论、问题和缩放法则解决方法:凯西@platformer.news。.