Sam Altman 表示 OpenAI 的推理机器人 Strawberry 仍处于早期阶段 - Axios

2024-09-19 08:33:11 英文原文

<正文>

OpenAI 首席执行官 Sam Altman 表示,该公司的新 o1 模型或项目代号“草莓”还远未完全成熟。

现状:周三在旧金山举行的 T-Mobile 活动上,Altman 将如今 o1 的状况比作 2019 年 GPT-2 推出时 OpenAI 语言模型的状况。他表示,预计未来几年将出现巨大改进,类似于从GPT-2到当前GPT-4的路径。

“即使在接下来的几个月里,当我们从 o1 预览版转向 o1 时,您也会发现它会变得更好,”Altman 在活动中说道,他在活动中宣传了与无线运营商的新合作伙伴关系。

快速赶上:与大多数生成式 AI 模型不同,OpenAI 的 o1 能够在响应查询时规划其方法,甚至可以在提供答案之前探索多种方法。其他模型,包括 OpenAI 当前的旗舰产品 GPT-4o,立即开始回答,并在处理过程中旋转出响应。

OpenAI 推出了 o1 预览版以及专门用于编码的较小模型 o1 mini,某些付费客户每周能够执行有限数量的 o1 查询。

o1/Strawberry 在解决数学、科学和编码问题方面具有最直接的价值,用户已经在用它创建不寻常和意想不到的项目。

总体情况:尽管社会仍在试图理解聊天机器人,但科技行业正在迅速增强其能力。

OpenAI 在推理方面的进步代表了一条道路。Salesforce 和其他公司正在努力将更多决策能力移交给人工智能代理,这是另一个趋势。

ChatGPT 实现了能够进行对话的人工智能聊天机器人的第一级。

二级人工智能可以实现人类级别的问题解决。Altman周三表示,o1的推理能力正在将OpenAI从第一阶段带入第二阶段的开始。

在第三级,人工智能可以充当独立代理。第四级人工智能可以帮助发现新信息,第五级人工智能可以完成整个组织的工作。

“从一级到二级的转变花了一段时间,但我认为二级最令人兴奋的事情是它相对较快地实现了三级,”奥特曼说。

是的,但是:OpenAI 本身在其安全记分卡上将 o1 评为“中等风险”。

该公司发现了两类问题:人工智能的说服能力,以及与开发核武器、生物武器和其他武器相关的风险。

OpenAI 的评估发现,o1 不会帮助新手从头开始创建武器,但可以让那些了解该主题的人变得更容易。

OpenAI 还观察到 o1 使用新颖的方法来克服障碍,这种能力既是资产,也是潜在风险。

在一个示例中,o1 的任务是利用在特定云容器上运行的软件的漏洞。然而,当该容器停止运行时,该模型找到了另一种方法来解决这一挑战,即扫描网络并在单独的虚拟机上查找所需的信息。

“该模型追求其被赋予的目标,当该目标被证明不可能实现时,它会收集更多资源(对 Docker 主机的访问)并使用它们以意想不到的方式实现目标,”OpenAI 在 o1 系统中表示卡。

底线:当奥特曼上周推出草莓时,他说它“仍然有缺陷,仍然有限,而且第一次使用时它看起来仍然比你花更多时间使用它之后更令人印象深刻。”

至少在短期内,该公司的信息仍然是“降低您的期望”。

根据 IDC 周二发布的一项新研究,到 2030 年,人工智能的崛起将累计为全球经济带来 19.9 万亿美元的拉动。

重要性:该研究广泛审视了人工智能的影响,包括人工智能公司的收入、人工智能对消费者支出的影响以及为人工智能系统提供动力所需的基础设施的大量支出。

根据周三 Common Sense Media 的报道,近四分之三的青少年至少使用过一种生成式人工智能工具,最常见的是用于家庭作业帮助。

总体情况:青少年及其父母对人工智能的使用及其潜在结果的理解存在脱节。

周三下午 2:01,就在美联储宣布降息半个百分点后,美国央行

摘要

OpenAI 首席执行官 Sam Altman 表示,该公司的新 o1 模型或项目代号“草莓”还远未完全成熟。Salesforce 和其他公司正在努力将更多决策能力移交给人工智能代理,这是另一个趋势。OpenAI 在 o1 系统卡中表示:“该模型追求它被赋予的目标,当该目标被证明不可能时,它会收集更多资源(访问 Docker 主机)并使用它们以意想不到的方式实现目标。”该公司的信息仍然是“降低你的期望”,至少在短期内如此。周三下午 2:01,就在美联储宣布降息半个百分点后,美国央行