加入我们的每日和每周时事通讯,了解有关行业领先人工智能报道的最新更新和独家内容。了解更多
人工智能推理时代正在悄然而至。
OpenAI再次掀起人工智能革命后o1推理模型早在 2024 年 9 月就推出了——它需要更长的时间来回答问题,但会带来更高的性能回报,特别是在数学和科学领域的复杂、多步骤问题上——商业人工智能领域已经充斥着模仿者和竞争对手。
有DeepSeek 的 R1,谷歌 Gemini 2 闪光思维,就在今天,美洲驼V-o1,所有这些都试图为 OpenAI 的新 o1 和即将推出的 o3 模型系列提供类似的内置“推理”功能。这些模型从事– 思维链 – (CoT) 提示– 或“自我提示” – 迫使他们在中途反思自己的分析,回过头来检查自己的工作,最终得出一个比直接从自己的想法中得出更好的答案嵌入尽可能快,就像其他大型语言模型 (LLM) 所做的那样。
然而,o1 和 o1-mini 的成本很高(GPT-4o 的成本为 15.00 美元/100 万美元,而 GPT-4o 的成本为 1.25 美元/100 万美元)OpenAI 的 API)导致一些人对所谓的性能提升犹豫不决。它真的值得支付 12 倍于典型的、最先进的 LLM 的费用吗?
事实证明,皈依者的数量在不断增加——但解锁推理模型的关键——真正的价值可能在于用户以不同的方式提示他们。
Shawn Wang(AI新闻服务创始人斯摩尔)在他的子栈周末,Ben Hylak 发表了一篇客座文章,他是前苹果公司、visionOS(为 Vision Pro 空间计算耳机提供动力)的界面设计师和联合创始人Dawn,人工智能产品分析和诊断平台。
这篇文章迅速走红,因为它令人信服地解释了 Hylak 如何促使 OpenAI 的 o1 模型获得(对他而言)极其有价值的输出。
简而言之,人类用户不应该为 o1 模型编写提示,而应该考虑编写“简报”或更详细的解释,其中包括大量有关用户希望模型输出内容的上下文,用户是谁以及他们希望模型以什么格式为他们输出信息。
正如海拉克所写子栈:
对于大多数模型,我们都经过训练告诉模型我们希望它如何回答我们。例如Ø 您是一位专业的软件工程师。慢慢地、仔细地思考—
这与我在 o1 上取得成功的方式相反。我不会指导它如何做,而只会指导它做什么。然后让o1接手,规划并解决自己的步骤。这就是自主推理的目的,并且实际上比您作为“循环中的人”手动查看和聊天要快得多。
Hylak 还包含一个带注释的很棒的 o1 提示示例屏幕截图,它为徒步旅行列表生成了有用的结果:
这篇博文非常有帮助,OpenAI 自己的总裁兼联合创始人 Greg Brockman 在他的 X 帐户上与信息: –o1 是一种不同类型的模型。出色的性能需要以相对于标准聊天模型的新方式使用它。
我在反复追求学习说流利的西班牙语时亲自尝试过这是结果,对于那些好奇的人。也许不如 Hylak 结构完善的提示和响应那么令人印象深刻,但绝对显示出强大的潜力。
另外,即使涉及到 Claude 3.5 Sonnet 等非推理法学硕士,普通用户也可能有改进他们的提示以获得更好、更少约束的结果的空间。
正如前 Teton.ai 工程师、现任神经调节设备 openFUS 的创始人 Louis Arge 所说,写在X上,“我发现的一个技巧是法学硕士更相信他们自己的提示,而不是我的提示,”并提供了一个例子,说明他如何说服克劳德“不再是个胆小鬼”——就其输出与他“引发”一场战斗。
所有这些都表明,随着人工智能时代的发展,即时工程仍然是一项有价值的技能。
使用 VB Daily 每日洞察业务用例
如果您想给老板留下深刻印象,VB Daily 可以满足您的要求。我们为您提供有关公司在生成人工智能方面所做的事情的内幕消息,从监管转变到实际部署,以便您可以分享见解以实现最大投资回报率。
阅读我们的隐私政策
感谢您的订阅。查看更多VB 时事通讯在这里。
发生错误。