开放人工智能失去了领先地位,机器人技术卷土重来

2024-10-15 18:04:00 英文原文

作者:Jeremy Kahn

hello,欢迎来到《Eye on AI》。本期内容……AI成本的迅速下降……谷歌进军核能领域……大型语言模型可能没有你想象的那么聪明……以及一位电影制作人因生成式AI反噬而受挫。

过去七年里,Nathan Benaich,这家早期人工智能投资公司的创始人兼唯一的普通合伙人,每年都空气街资本,发布了一份权威的《人工智能现状》报告。Benaich及其合作者汇集了大量的数据,提供了对该技术不断发展的能力、开发该技术的公司格局、AI部署情况的调查以及对领域仍面临挑战的关键性审视的一个很好的快照。

开放人工智能(OpenAI)的优势基本上消失了

今年报告的一个重要结论是,哪一部分没有给出完整句子,但根据提供的信息,可以初步翻译为:“今年报告的一个重要结论是” 如果有后续具体内容,请提供完整句子以便准确翻译。原文:One of the big takeaways from this year’s report, which was上周晚些时候发布,OpenAI相对于其他人工智能实验室的领先地位已经大大削弱。Anthropic的Claude 3.5 Sonnet、Google的Gemini 1.5、X的Grok 2以及甚至Meta开源的Llama 3.1 405B模型在某些基准上已经持平或略胜一筹,超过了OpenAI的GPT-4。

但是另一方面,随着OpenAI发布了其o1“草莓”模型,在推理任务上它目前仍然保持优势。Air Street的报告恰如其分地将其描述为一种奇怪的混合体:对于某些任务具有极其强大的逻辑能力,而对于其他任务则表现出令人惊讶的薄弱。(关于o1推理能力的脆弱性,请参见下面的“研究”部分。)

推理成本迅速下降

另一个重要收获是,本纳奇告诉我,使用经过训练的AI模型的成本——被称为“推理”活动——正在迅速下降。这有几个原因。其中一个原因是与第一个重要收获有关:随着模型在能力和性能上的差异减小,公司被迫以价格竞争。

另一个原因是,像OpenAI和Anthropic这样的公司的工程师及其超大规模合作伙伴微软和亚马逊网络服务(AWS)分别发现了如何优化最大规模的模型在大型GPU集群上运行的方法。今天,从OpenAI的GPT-4o产生的每令牌输出成本比该模型于2023年3月发布时低100倍(大约相当于1.5个单词)。谷歌的Gemini 1.5 Pro自今年2月推出以来,每个输出令牌的成本降低了76%。

AI研究人员也擅长创建小型AI模型,这些模型在对话、摘要甚至编码方面的表现可以与更大的语言模型相媲美,但运行成本却低得多。综合来看,这两种趋势意味着实施基于AI的解决方案的经济性开始比一年前看起来更有吸引力。这最终可能帮助企业找到他们之前认为难以实现的生成式AI的投资回报率。

机器人技术卷土重来

Benai指出的另一个重要趋势是机器人技术正重新流行起来,机器人公司通过将大型语言模型(LLMs)和新的“世界模型”与现有技术结合,使机器人更加智能、更易于(且更便宜)部署和定制,从而在提高机器人的能力方面取得了显著进展。

Benaich的《人工智能状态》报告总是以对未来一年的一些大胆预测结束(并且Benaich每年都会根据自己的表现给自己打分。)他去年说对的事情包括:好莱坞制作会利用生成式AI模型进行视觉效果,以及在国际人工智能治理方面的进展有限。他说错的事情包括:有一家公司会在训练单一的大规模语言模型上花费超过10亿美元。

今年,在报告的预测中,有一个开源替代品将在多个基准测试中超越OpenAI的o1,另一个预测是一个主权国家对一家美国人工智能公司的10亿美元投资将导致美国政府进行国家安全审查。明年我们将回顾Benaich的预测是否准确。

福布斯Brainstorm AI洞察快速变化的行业脉动

《State of AI报告》并不是了解人工智能领域最新动态的唯一途径。另一个绝佳的选择是福布斯即将在旧金山举行的Brainstorm AI会议,该会议是一个深入了解人工智能迅速变化的格局以及人工智能如何影响商业的绝佳场所。这个一年一度的必参加活动将于12月9日和10日在圣雷吉斯酒店举行。

今年的大会将包括与多名嘉宾的对话,其中包括亚马逊的人工通用智能首席科学家。罗希特·普拉萨德,将向我们更新关于everything store( everything store在这里指代的是亚马逊)如何确保自己不会在建造超级强大且极其有用的AI的竞争中落后的情况。莉兹·里德谷歌搜索副总裁,将讨论谷歌标志性产品在人工智能世界中的未来;克里斯托弗·扬微软负责业务发展、战略和企业的执行副总裁,将讨论这家科技巨头如何努力洞察未来人工智能的发展趋势。丹尼埃拉·布里加,Defined.ai 的创始人兼首席执行官,他将告诉我们构建真正为客户服务的 AI 模型实际上需要什么;和科林· Kaepernick曾任旧金山49人队的超级碗四分卫,目前是Lumi公司创始人兼首席执行官,该公司开发用于内容创作者的人工智能工具。他将讲述自己从职业运动员转型为企业家的经历,并探讨人工智能对网红、品牌以及更广泛领域的影响。

我当然会到场,与一群才华横溢的同事共同主持讨论。希望你们都能考虑加入我!而且我很兴奋能够为《Eye on AI》的读者提供特别优惠折扣——享受正常参会价格的20%折扣!只需输入代码KAHN20在申请表的附加评论部分填写以确保您的折扣。您可以点击这里了解更多,请点击页面上的链接申请参加。记得使用折扣码!

以下是一些最新的人工智能新闻。

杰里米·卡恩
jeremy.kahn@fortune.com
@jeremyakahn

新闻中的人工智能

印度央行行长表示人工智能带来金融稳定风险。印度储备银行行长夏克蒂坎塔·达斯成为最新一位警告称,人工智能在金融服务领域的日益使用带来了潜在风险的人央行负责人,尤其是如果银行和对冲基金主要依赖少数几家技术供应商的情况下,路透社报道。报告的.

《纽约时报》针对生成式人工智能搜索创业公司Perplexity发起批评。该报纸的律师已向Perplexity发送了“停止和终止”函,要求其停止未经授权访问和使用该出版物的内容。华尔街日报 报告的 perplexity首席执行官Aravind Srinivas告诉了日记该公司并没有忽视时代杂志请求,并将在月底之前回复其信函。“我们在这里没有任何成为任何人对手的兴趣,”斯里尼瓦斯告诉该报纸。The纽约时报已经因涉嫌违反版权法通过摄入而与OpenAI卷入诉讼中时代杂志内容。(完全披露:)财富与Perplexity有许可协议。

谷歌订购小型核反应堆以满足数据中心日益增长的人工智能能源需求。无 내용 제공되지 않았습니다. 原文输出如下:The守护者报告该科技巨头与位于加州的Kairos Power达成了协议,将部署六到七个小型核反应堆为数据中心提供电力,这些数据中心将用于训练和运行AI模型。第一座反应堆预计在2030年投入运营。大型云服务提供商越来越多地考虑使用核电来为数据中心供电,而不增加其碳足迹。亚马逊和微软都在最近几个月达成了核电协议。

OpenAI的前首席技术官Mira Murati正在试图为一个新的项目挖角员工,而公司内部动荡仍在继续。那根据在《信息》杂志上的报道,援引了两位熟悉Murati联络工作的匿名消息来源。根据该出版物的报道,Murati尚未告知员工她是否要启动自己的创业公司,还是试图吸引OpenAI的员工加入她即将加盟的一家现有公司。此外,据报道,在其前负责人Barret Zoph离职(Zoph的离职与Murati宣布的消息在同一天发布)以及由Liam Fedus接替之后,OpenAI的后训练团队目前陷入了动荡之中。据称,一些研究人员已经请求调到其他团队工作,而不是继续留在Fedus手下工作。

开放人工智能从微软聘请关键研究人员。信息 сообщение 似乎是要求将“The Information”翻译成中文。正确的翻译应该是: 信息报告据称,领导微软开发一系列高性能开源小型语言模型(称为Phi)的塞巴斯蒂安·布贝克已被吸引到OpenAI。这可能意味着OpenAI希望训练类似类型的模型。这也可能预示着OpenAI与其主要支持者和合作伙伴微软之间的紧张关系将进一步加剧。

AI研究聚焦

LLM们真的在推理吗?六位来自苹果公司的研究人员的一项挑衅性的研究提出,答案是否定的——或者至少可以说,机器并不特别擅长此,与人类的表现相差甚远。

研究人员发现,问题措辞的细微变化或在问题中添加无关信息会导致大型语言模型在基准测试中的表现显著下降。即使是最近、最强大的AI模型,包括专门为推理任务设计得更好的OpenAI o1-preview,在研究人员创建的修改后的数据集上也出现了性能下滑。这表明所有这些模型的推理能力被夸大了,实际上它们主要只是记住了训练过程中遇到的问题的答案。

同时,研究显示最新的最强大的大规模语言模型的性能下降不如较小规模的模型明显。因此,可能最大的模型在接近人类推理方面表现更好,而较小规模的模型则不然。

您可以在arxiv.org上阅读完整的研究论文这里

关于AI的 fortune (上下文不明确,直译保留原形式)

为什么埃隆·马斯克的Cybercab自动驾驶出租车愿景仍可能还需要几年的时间—杰西卡·马瑟斯

自ChatGPT发布以来,美国国防部和国土安全部已在人工智能项目上投入了7亿美元。—凯莉·海斯

Wendy汽车穿梭点餐中的AI系统,让订购快餐更快捷—约翰·凯尔著

AI日历

10月22-23日:泰德AI,旧金山

10月28-30日:语音与人工智能,弗吉尼亚州阿灵顿

11月19-22日:微软ignite大会,芝加哥

12月2日至6日:AWS re:Invent,拉斯维加斯

12月8-12日:神经信息处理系统(NeurIPS)2024,不列颠哥伦比亚省温哥华

12月9-10日:福布斯大脑风暴AI,旧金山(注册)这里)

脑食物

观众对生成式AI的反对是否会减缓创作者广泛采用它的进程?也许吧。电影制作人摩根·内维尔告诉了 Wired他在自己的纪录片《安东尼·波登的一生》中使用人工智能重现已故厨师和旅行记者安东尼·波登的声音而遭到粉丝们的广泛批评后,表示以后不会再在他的电影中使用AI。道路跑步者。尽管Neville使用的是AI生成的声音来朗读由Bourdain实际撰写的内容,但AI的使用还是让观众感到困惑,Neville表示。 Wired许多人认为电影中的那些方面完全是虚构的,他感慨道。总的来说,尼维尔说人工智能的使用已经损害了……路 runner 的观众的信任度。

尼维尔并不是唯一一个发现AI会损害辛苦得来的信誉的创作者。玩具制造商乐高——巧合的是,它是尼维尔关于音乐人Pharrell Williams的新纪录片中的核心媒介。一点一滴——乐高爱好者早前对这项技术的试验反应强烈之后,该公司已誓言不再使用生成式AI来创建目录和广告。

这是《财富》周刊关于人工智能如何塑造商业未来的眼界AI在线版。免费注册.

关于《开放人工智能失去了领先地位,机器人技术卷土重来》
暂无评论

摘要

在这个版本中……人工智能成本迅速下降……谷歌进军核能领域……大型语言模型可能没有你想象的那么聪明……以及一位电影制作人因生成式AI的负面反应而受挫。谷歌于2024年2月发布的Gemini 1.5 Pro现在每输出令牌的成本降低了76%。人工智能研究人员也擅长创建小型人工智能模型,这些模型在对话、摘要甚至编码方面的表现可以与大型语言模型相媲美,但运行成本却要低得多。据《华尔街日报》报道,《报纸》的律师向Perplexity发送了一份“停止和终止”信函,要求其停止未经授权访问和使用该出版物的内容。OpenAI从微软聘请了一位关键研究员。尽管内维尔只使用了人工智能生成的声音来朗读由布劳迪亲自撰写的文本,但这种做法让观众感到困惑,内维尔告诉《连线》杂志。