英语轻松读发新版了,欢迎下载、更新

ChatGPT 的高级语音模式终于在 OpenAI 第六天获得视觉上下文

2024-12-12 18:54:00 英文原文

作者:Written by Sabrina Ortiz, Editor Dec. 12, 2024 at 10:54 a.m. PT

OpenAI displayed on a phone
NurPhoto/贡献者/盖蒂图片社

随着假期的临近,许多公司都在想方设法通过促销、促销或其他活动来利用这一机会。OpenAI 已经找到了参与其“12 天 OpenAI”系列活动的方式。

周三,OpenAI 通过X 帖子帖子称,从 12 月 5 日开始,该公司将举办为期 12 天的直播,并发布“一系列大大小小的新东西”。 

还:OpenAI 的 Sora AI 视频生成器来了 - 如何尝试

以下是您需要了解的有关该活动的所有信息,以及每日掉落的汇总。 

“OpenAI 12 天”是什么?

OpenAI 首席执行官 Sam Altman 分享了有关该活动的更多细节,该活动于太平洋时间 12 月 5 日上午 10 点开始,并将持续 12 个工作日,每天进行一次发布或演示的直播。奥特曼表示,这些产品的发布将是“大件”或“圣诞礼物”。 

从太平洋时间明天上午 10 点开始,我们将进行为期 12 天的 Openai。
每个工作日,我们都会举办一场直播,其中包括发布或演示、一些大型活动和一些圣诞礼物。
我们有一些很棒的东西要分享,希望您喜欢!圣诞快乐。

– 萨姆·奥尔特曼 (@sama)2024 年 12 月 4 日

到目前为止,已经放弃了什么?

12 月 12 日,星期四

当直播开始时,OpenAI 解决了房间里的大象——该公司的直播在前一天中断的事实。OpenAI 对给您带来的不便表示歉意,并表示其团队正在进行事后分析,并将在今天晚些时候发布。 

然后它直接成为新闻——另一个备受期待的公告: 

  • 高级语音模式现在具有屏幕共享和视觉功能,这意味着它可以帮助了解正在查看的内容,无论是来自手机摄像头还是屏幕上的内容。 
  • 这些功能建立在高级语音已经做得很好的基础上——像人类一样进行随意的对话。自然的对话可以被打断,可以多轮转,并且可以理解非线性的思路。 
  • 在演示中,用户从 ChatGPT 的高级语音中获取有关如何冲泡咖啡的指导。当演示者完成这些步骤时,ChatGPT 会口头提供见解和指导。 
  • 圣诞节还有另一个好处:用户可以使用新的圣诞老人声音。要激活它,用户所要做的就是单击雪花图标。Santa 今天将在所有用户可以访问 ChatGPT 语音模式的地方推出。第一次与圣诞老人交谈时,即使您已经达到限制,您的使用限制也会重置,因此您可以与他交谈。 
  • 从今天开始到下周,视频和屏幕共享将在最新的移动应用程序中向所有 Team 用户以及大多数 Pro 和 Plus 订阅者推出。欧洲的 Pro 和 Plus 订户将“尽快”获得访问权限,Enterprise 和 Edu 用户将在明年初获得访问权限。 

12 月 11 日星期三

苹果发布iOS 18.2今天。该版本包括与聊天GPT涵盖 Siri、写作工具和视觉智能。因此,今天的直播重点介绍了集成。 

  • Siri 现在可以识别您何时提出超出其范围的问题,而这些问题可以通过 ChatGPT 的回答而受益。在这些情况下,它会询问您是否想使用 ChatGPT 处理查询。在任何请求发送到 ChatGPT 之前,总会出现一条通知用户并请求许可的消息,尽可能将控制权交到用户手中。 
  • 视觉智能是指 iPhone 16 系列的一项新功能,用户可以通过点击“相机控制”按钮来访问该功能。相机打开后,用户可以将其指向某物并使用 Google 搜索网络,或者使用 ChatGPT 了解有关他们正在查看的内容的更多信息或执行其他任务,例如翻译或总结文本。 
  • 书写工具现在具有新的“撰写”工具,允许用户利用 ChatGPT 从头开始​​创建文本。借助该功能,用户甚至可以使用 DALL-E 生成图像。 

所有上述功能均受到 ChatGPT 的每日使用限制的约束,就像用户在 ChatGPT 上使用该模型的免费版本时会达到限制一样。用户可以在“设置”中选择是否启用 ChatGPT 集成。

在这里阅读更多相关信息:iOS 18.2 推出 iPhone:立即尝试这 6 个新的 AI 功能

12 月 10 日星期二 

  • 帆布无论计划如何,所有网络用户都将在GPT-4o,这意味着它不再仅在测试版中可用聊天GPT Plus用户。
  • Canvas 已原生内置于 GPT-4o 中,这意味着您只需调用 Canvas,而不必转到模型选择器上的切换按钮。 
  • Canvas 界面与用户在 ChatGPT Plus 测试版中看到的界面相同,左侧有一个表格,显示 Q+A 交换,右侧选项卡显示您的项目,显示所有编辑内容,以及快捷方式。 
  • 画布也可以与自定义 GPT。创建新 GPT 时它默认处于打开状态,并且可以选择将 Canvas 添加到现有 GPT。 
  • Canvas 还能够直接在 Canvas 中运行 Python 代码,从而允许聊天GPT执行编码任务,例如修复错误。 

在这里阅读更多相关信息: 我是 ChatGPT 高级用户 - 一个月后,Canvas 仍然是我最喜欢的生产力功能

12 月 9 日星期一

OpenAI 将第三天的发布戏称为“你一直在等待的东西”,随后备受期待的视频模型 Sora 也随之发布。以下是你需要了解的内容:

  • 被称为索拉涡轮,视频模型比预览的二月模型更智能。 
  • 今天晚些时候将在美国推出;用户只需要 ChatGPT Plus 和 Pro。
  • Sora 可以生成视频到视频、文本到视频等。 
  • ChatGPT Plus 用户每月最多可以生成 50 个 480p 分辨率的视频或更少的 720p 分辨率视频。专业计划提供 10 倍以上的使用量。 
  • 新型号比二月份预览的型号更智能、更便宜。 
  • Sora 具有一个探索页面,用户可以在其中查看彼此的创作。用户可以点击任何视频来查看它是如何创建的。 
  • 现场演示展示了该模型的使用情况。演示者输入提示并选择宽高比、持续时间,甚至预设。我发现现场演示视频结果真实且令人惊叹。 
  • OpenAI 还推出了 Storyboard,这是一种让用户为序列中的每一帧生成输入的工具。 

12 月 6 日星期五:

在“shipmas”的第二天,OpenAI 扩大了对其强化微调研究计划的访问范围:

  • OpenAI 表示,强化微调计划允许开发人员和机器学习工程师微调 OpenAI 模型,以“擅长特定的复杂、特定领域的任务集”。 
  • 强化微调是指一种定制技术,开发人员可以通过输入任务并对输出进行分级来定义模型的行为。然后,模型使用此反馈作为改进指南,更好地推理类似问题,并提高整体准确性。
  • OpenAI 鼓励研究机构、大学和企业申请该计划,特别是那些执行狭窄复杂任务的机构、大学和企业,可以从人工智能的帮助中受益,并执行具有客观正确答案的任务。 
  • 名额有限;有兴趣的申请人可以通过填写申请这个表格。一个 
  • OpenAI 的目标是在 2025 年初公开强化微调。

12 月 5 日,星期四: 

OpenAI 一开始就轰动一时,推出了对其聊天机器人的两项重大升级:聊天GPT订阅、ChatGPT Pro 以及该公司的完整版 o1型号。一个 

o1 的完整版: 

  • 除了数学和科学之外,对于各种提示都会更好
  • 与 o1-preview 相比,犯重大错误的频率大约减少 34%,同时思考速度加快 50%
  • 今天推出,取代所有 o1-preview聊天GPT Plus现在是专业用户 
  • 允许用户输入图像(如演示中所示)以提供多模式推理(对文本和图像进行推理) 

ChatGPT 专业版:

  • 面向 ChatGPT Plus 超级用户,让他们无限制地访问 OpenAI 所提供的最佳功能,包括无限制地访问 OpenAI o1-mini、GPT-4o 和高级模式
  • 具有 o1 pro 模式,该模式使用更多计算来推理最难的科学和数学问题 
  • 每月费用 200 美元 

在哪里可以观看直播?

直播在 OpenAI 网站上进行,并立即发布到其 YouTube 频道。为了方便访问,OpenAI 还将在直播开始前 10 分钟(太平洋时间上午 10 点/太平洋时间下午 1 点左右)在其 X 帐户上发布直播链接。每日东部时间。 

你能期待什么?

这些发布仍然令人惊讶,但许多人预计索拉OpenAI 的视频模型最初于去年 2 月宣布,将作​​为其中一项更大的发布的一部分推出。自首次宣布以来,该模型已可供一组特定的红队成员和测试人员使用,并于上周被一些测试人员因对“无偿劳动”的不满而泄露。据报道。一个 

还:OpenAI 的 o1 比任何主要的 AI 模型都更谎言。为什么这很重要

其他传闻中的版本包括该公司 o1 LLM 的新的、更完整的版本,具有更先进的推理功能,以及 OpenAI 高级语音模式的圣诞老人声音, 每个发现的代码就在几周前,用户还使用代号“Straw”。 

编辑标准

关于《ChatGPT 的高级语音模式终于在 OpenAI 第六天获得视觉上下文》的评论


暂无评论

发表评论

摘要

OpenAI 的“shipmas”活动是为期几天的一系列公告和产品发布。以下是每天的主要亮点:### 12 月 5 日(第一天)- **ChatGPT Pro**:新的订阅层,可以无限制地访问 OpenAI 提供的最佳功能,包括 o1-mini 和 GPT-4o 模型。- **o1 模型的完整版本**:改进的版本,在各种提示中提供更好的性能,与预览模型相比,重大错误更少(减少 34%),思维更快(50%),多模态推理能力(文本和图像)。### 12 月 6 日(第二天)- **强化微调研究计划扩展**:- 允许开发人员和机器学习工程师针对特定的复杂任务微调 OpenAI 模型。- 申请人可以通过表格进行申请,名额有限,目标是在 2025 年初公开。### 12 月 9 日(第 5 天)- **Sora 视频模型**:- 比二月预览版更智能、更便宜。- 当天晚些时候向美国的 ChatGPT Plus 和 Pro 用户开放。- 用户可以根据文本到视频、视频到视频提示生成视频,并提供宽高比、持续时间和预设选项。- 具有探索页面,用户可以在其中查看其他创作并了解它们是如何制作的。### 12 月 11 日(第 7 天)- **画布功能**:- 扩展了对 ChatGPT Pro 层中 Canvas 功能的访问。- 允许用户直接在工具内运行Python代码,提高工作效率。### 附加功能和公告- **故事板工具**:引入用于为序列中的每个帧生成输入。- **现场演示**:Sora 视频模型展示了令人印象深刻的结果。### 访问和未来更新- 每天上午 10 点(太平洋时间)/下午 1 点(东部时间)在 OpenAI 网站和 YouTube 频道上进行直播。- 对未来版本的猜测包括推出更完整版本的 o1 LLM,具有更高级的推理功能,以及高级语音模式的圣诞老人语音等功能。总体而言,“shipmas”对 OpenAI 的产品和服务进行了重大更新,满足了休闲用户和希望将 AI 融入工作的开发人员的需求。