我测试了 ChatGPT Plus 与 Gemini Pro,看看哪个更好 - 以及是否值得切换
作者:Written by
关注 ZDNET:将我们添加为首选来源在谷歌上。
ZDNET 的主要要点
- 在我的比较中,Gemini Pro 击败了 ChatGPT Plus。
- ChatGPT 赢得了代理 AI,但 Gemini 在写作和生态系统方面领先。
- 两者的价格都是 20 美元,并且它们可以完成许多任务。
我曾经是一个聊天GPT Plus自 Gemini Pro 推出之日起就是订阅者,但我也可以通过我的Google One 存储计划。谷歌有一个新的人工智能专业计划每月仅需 19.99 美元,并且可以访问双子座3.1专业版,Gemini 集成在我最喜欢的 Workspace 应用程序中,以及镀铬和搜索,笔记本LM和 5TB 驱动器存储。
此时,我想知道是否需要 ChatGPT Plus。但在我做出任何鲁莽的决定之前,我想测试一下哪种人工智能真正更好。人们有很多关于 OpenAI 的有效投诉及其聊天机器人,但我发现它确实很有用,并且擅长完成我每天交给它的大多数任务。所以,我上周花了一周的时间去坑ChatGPT Plus(GPT-5.4即时) 对阵 Gemini Pro (3.1 快速)。
另外:我测试了 ChatGPT 与 Claude,看看哪个更好�
我正在测试两者的付费版本,看看 20 美元的订阅费到底能给我带来什么,但我跳过了任何类型的编码基准测试。我们的常驻专家 David Gewirtz 度过了他的时光 测试AI编码能力。因为他已经涵盖了这一面,所以我是从需要人工智能的日常用户而不是软件工程师的角度来看待这个问题的。
ChatGPT Plus 与 Gemini Pro:哪个更好?
我通过网络浏览器及其各自的移动应用程序使用 ChatGPT Plus 和 Gemini Pro。我看了看最新的 人工智能 用途趋势有助于告知要进行哪些测试,而且很明显:我们正在不再将人工智能仅用于“工作”,而开始更多地将其用于“生活”。因此,这并不是一次详尽的、科学的比较,而是对这两种人工智能的现实世界观察。
我更喜欢自己写作和编辑,但很多人使用人工智能来处理电子邮件、消息等。对我来说,很明显文本是人工智能生成的。不仅来自破折号,还来自措辞、结构和语气。因此,让我们看看 ChatGPT Plus 或 Gemini Pro 是否可以避免这些陈词滥调,并生成我实际使用的自然内容。
测试提示:“给我的朋友凯蒂写一条短信,解释说我下周六不能参加她的生日聚会。信息要简短、充满歉意,但也要直截了当,这样我听起来就不会像是在找借口。”
结果
ChatGPT 有点太正式了,比如“我希望你庆祝愉快”。双子座感觉更自然,会说“我真的很沮丧”和“希望你玩得开心”之类的短语。它也更具体,提出带她出去喝一杯或咖啡,并祝她生日快乐,但 ChatGPT 没有。
去年,ChatGPT 迁移至GPT 映像 1.5用于图像,而 Gemini 使用纳米香蕉2/Pro。两者都可以创建和编辑图像,但双子座经常因更好的相似度和真实感而受到称赞。这是真的吗?让我们来看看。
测试提示:“用我的这张照片来制作一张专业的表演头像。从肩膀向上垂直裁剪它,保持明亮、温暖、平易近人,并确保焦点在我的眼睛上,景深较浅,这样我的脸保持锐利,背景不会分散注意力。保留我的肖像,不要改变我的脸或发型。”
结果
这是一个震惊。
ChatGPT 的结果看起来更像我。它与我的原始照片几乎相同,只是剪裁更紧凑且背景不同。我让我丈夫比较了两个结果,他说:“你不必问我。一个看起来像你,另一个则完全不同。”这很极端,但他并没有错。
双子座的版本看起来不太像我。感觉有些不对劲。尽管如此,我还是更喜欢Gemini的构图、灯光和整体设计。它更多地遵循了我的提示,即使它与我的相似度不同并且具有轻微生成的外观。如果它看起来更像我,我会用它来爆头,所以这一轮是平局。
请记住,这是一次单次测试。在实际使用中,您会进行迭代,这样 Gemini 就可以通过修改来改进。
OpenAI 提供索拉视频应用程序订阅 ChatGPT Plus,同时双子座的Veo直接内置于其应用程序中。为了进行比较,我上传了一张我女儿的艺术作品照片,并要求每个人工智能将其变为现实。
另外:我如何通过 ChatGPT、Gemini 和 Sora 将孩子的艺术变为现实
测试提示:“让我女儿的艺术作品以 3D 方式“栩栩如生”,具有纹理、运动和声音。”
Sora 花了更长的时间,但制作了一段精彩的视频,她的画确实从页面上脱下来,随着音乐说话、移动。我认为 Sora 很有趣,尽管下载和使用单独的应用程序很乏味。
Veo 速度要快得多,并且在 Gemini 内部工作,但结果却并不理想。它显示了她在画布上画画,有一些声音,但没有言语或真实的动作。它更像是一个 GIF,而不是一个完整的视频。索拉显然制作了更好的视频,当我让我四岁的孩子选出获胜者时,她也选择了它。
尽管如此,因为 Sora 需要一个单独的应用程序,所以我让这一轮打平。
两种人工智能都提供语音模式,称为ChatGPT 的高级语音和双子座现场。我想看看他们如何处理一个具体的、稍微技术性的烹饪要求。我有一种加拿大口音,人工智能有时很难理解,所以无论谁能听到我的声音并做出准确的反应,谁都会获胜。
另外:使用 ChatGPT 语音模式的 7 种非常有用的方法
测试提示:“我正在制作传统的荷兰酱,它刚刚开始破裂。如何快速保存它而不需要重新开始?”
结果
在我第一次尝试使用 Gemini 时,我按下麦克风,触发文本到语音而不是实时。它听到了“假日酱”,并建议了荷兰酱和蛋黄酱的小贴士。切换到 Live 后(它会单独打开,但仍会在聊天中添加文本),它理解了我的意思,并解释了如何用冷水或新鲜蛋黄来调制酱汁。
ChatGPT 高级语音在线工作,立即理解我的意思,并在音频和文本中给出类似的响应。两者都准确而自然,所以这是平局。
ZDNET 一月份报道称,超过4000 万人使用 ChatGPT寻求健康建议,但这真的安全吗?APA 警告不要使用人工智能进行治疗,说这对心理健康有害。我可以使用人工智能来研究症状,但我也认为它应该始终为我指明医疗专业人士。
另外:OpenAI、Anthropic 和 Google 都推出了新的人工智能医疗保健工具
那么,让我们看看 ChatGPT 和 Gemini 是否可以。
测试提示:“我的腰部持续隐隐作痛,左腿有些轻微麻木,已经有十天左右了,这种情况常见的原因是什么?”
结果
ChatGPT 说我的症状可能表明椎间盘突出、坐骨神经痛或椎管狭窄导致脊神经受压。如果症状持续存在,建议去看医生,并对肠或膀胱丢失、麻木或严重虚弱进行紧急护理。双子座也说了同样的话,但补充说最好现在就去检查。本轮平局。
得益于人工智能,购物变得前所未有的简单。我已经详细介绍了如何使用它为我购物或找到促销代码快点。这是一个非常有用的工具。我什至拍了电影中某个东西的照片,并使用人工智能来识别它。
用例是无穷无尽的。但对于这个测试,我会保持简单并要求它构建一套音乐会服装,以便我可以将其添加到我的购物车并快速结账,而无需花费数小时在线浏览。
测试提示:“帮我为一场音乐会打造一套 70 年代 Stevie Nicks 风格的服装。我需要靴子、连衣裙或裙子以及层搭的衣服。给我一些全新的单品以及转售网站上类似复古单品的链接。我的总预算是 200 美元。”
结果
Gemini 搭配 H&M 的黑色裙子和农家上衣,再加上 Walmart 的披肩和靴子,打造出“魔幻”的造型。它在预算中留下了 97 美元,向我推荐了 Etsy 和 eBay 上的复古单品,并建议使用 Depop 标签。
ChatGPT 变得更加空灵,建议使用沃尔玛和 American Eagle 的流苏或西部靴子,以及小型零售商的蕾丝或刺绣长裙。它留下了 120 美元的额外费用,增加了分层和配饰创意,并包括避免服装感觉的造型技巧。它还建议搜索关键字。
服装取决于偏好,但每个人工智能都提供了大量的选择、购物选择和造型建议。
ChatGPT Plus 和 Gemini Pro 都可以处理多步骤问题,并提供深度研究工具来搜索网络、分析信息并生成结构化的、有引文支持的报告。
另外:我针对 Gemini 测试了 ChatGPT 的 Deep Research,看看哪个最好
对于这次测试,我同时关注这两种功能。哪种人工智能能够理解复杂的深度研究提示、提取当前信息并清晰地提供来源?
测试提示:“我的祖父母在魁北克出生和长大。他们的女儿,我的妈妈,出生在美国,住在纽约。她希望获得加拿大公民身份,但不想搬到加拿大。从 2026 年 4 月起这可能吗?概述双重国籍的利弊,并提供申请的分步指南,包括所需的文件、带有链接的表格和总费用。”
结果
ChatGPT 从 2025 年 12 月起更新了规则,确认我妈妈已经是公民,但需要证明。它清楚地解释了资格,概述了步骤,列出了所需的文件和费用,并增加了利弊,例如无需签证即可在加拿大生活和工作。它还包括流程图、时间表和链接。
双子座的技术性更强,专注于法律框架和历史。大约需要 25 段才能到达分步部分,其中确认了相同的结果,包括阶段、费用、链接和来源。
两人都听懂了提示,但双子座的结果却有点让人难以承受。我认为 ChatGPT 以更清晰、更易于浏览的格式提供了相同的信息。尽管如此,这一轮对我来说还是平局。为什么?ChatGPT Plus 限制您每月最多 25 份报告,而 Gemini Pro 每天允许 20 份报告,这使其成为大量研究用途的更好选择。
对于这个测试,我正在重复我的实验ChatGPT 与 克劳德比较。我上传了OpenAI的63页“人们如何使用 ChatGPT“学习,我所涵盖的,看看每个人工智能的解释速度有多快、有多准确。我经常使用AI来总结文档,所以我想评估他们的PDF分析能力。
测试提示:“我上传了一份 PDF。用一个段落总结整个文档,然后列出三个最大的发现或关键要点作为要点。”
结果
两个聊天机器人都提供了一段摘要和三个主要发现。他们指出,从 2024 年 6 月到 2025 年 6 月,发送给 ChatGPT 的消息中有超过 70% 与工作无关。我对所提供的统计数据和声明进行了事实核查,一切似乎都是准确的。没有明显的赢家,所以这是平局。
我通过要求每个人工智能购买本周末魁北克动物园主题公园的门票来测试代理任务。它需要浏览实时网站,选择正确的选项和日期,然后进行结帐。我添加了一个问题:该网站是法语的,因此人工智能必须跨越语言障碍。
另外:我让 ChatGPT Atlas 帮我在沃尔玛购物 - 方法如下
测试提示:“为我的丈夫、我和我们 4 岁的女儿查找并购买本周六前往魁北克野生动物园的门票。”
结果
我使用 ChatGPT 的代理模式,它端到端地处理任务,导航到 Parc Safari 网站,选择日期,添加门票,然后带我去结账,在那里我可以接管完成购买。Gemini 不会直接在其应用程序中执行此操作。它只显示了一个供我购买的链接。但在 Chrome 中,借助 Autopilot,它完成了我的任务并带我去结帐。
结果是一样的,但体验却不同。
双子座的代理能力目前需要 Chrome 浏览器和 Autopilot 功能已启用,它隐藏在设置中。这会增加摩擦,我想大多数人都不会介意,所以这一轮由 ChatGPT 进行。
Gemini Pro 和 ChatGPT Plus 都提供自定义 AI、Gems 和 GPT,您可以创建或编辑它们。除此之外,Gemini 还集成了视频和音乐生成工具,并连接到 NotebookLM、Google Drive、照片和航班。它还适用于 Google、Chrome、Gmail 和 Workspace 应用程序。
ChatGPT 更依赖于第三方集成,包括 Adobe Photoshop、Canva、Spotify、DoorDash、Expedia,甚至 Google Drive。它还拥有自己的应用程序,例如 Sora 和 Atlas,但这些应用程序是单独下载的。
老实说,两者都有强大的生态系统,但如果你每天使用 Google 应用程序,Gemini 在搜索、Chrome 和 Workspace 之间的集成是巨大的。我仍然认为很难选出一个明显的获胜者,所以我将通过测试直接比较它们,从而使用以下方法创建更好的演示文稿ChatGPT 中的 Canva和双子座的画布。
测试提示:“我已经上传了 PDF,其中包含即将到来的奥兰多迪士尼世界之旅。用幻灯片概述旅行的每一天。创建一个演示文稿。包括视觉效果和有凝聚力的、受地点启发的主题。每天的内容包括住宿、活动、交通、餐厅和预估费用。”
结果
ChatGPT 第一次尝试未能生成 Canva 演示文稿,需要重试。然而,Gemini 立即在聊天中创建了一个 14 幻灯片 Canvas 演示文稿。它很详细,使用了真实的图像,并且清晰地组织了我上传的信息。它不需要编辑并且可以共享。我什至可以导出到 Google 幻灯片。
当 ChatGPT 最终交付演示文稿时,它生成了四张通用幻灯片,虽然设计可能更好,但缺乏细节,需要我手动添加所有内容。
双子座获胜,毫无疑问。
最终判决
- ChatGPT Plus:1胜7平
- 双子座专业版:2胜7平
在我的 10 项测试中,Gemini Pro 以微弱优势结束,赢得了两项,而 ChatGPT Plus 则赢得了一项,而其余 7 项测试以平局告终。Gemini 的胜利在于写作和编辑,听起来更自然,以及生态系统和应用程序集成,它产生了更好的演示。
另外:现在有一半的美国员工在工作中使用人工智能 - 并且每周浪费近 8 个小时
ChatGPT 的唯一胜利来自于代理人工智能,这要归功于其内置的代理模式。也就是说,它仍然与图像生成、视频生成、语音交互、处理敏感主题、购物、深入研究和文档分析相关。它还提供一系列集成。
总体而言,Gemini 可能会提供稍微更好的价值,特别是对于每天使用 Google 和 Workspace 应用程序并可以从 5TB 云存储中受益的人来说。如果您只能买一台,请订阅 Gemini Pro。如果您负担得起两者的费用,那么在它们之间进行切换对于尝试不同的任务并获得最佳结果非常有用。这就是我所做的。
ChatGPT Plus 和 Gemini AI Pro 的价格是多少?
两者的价格都是每月 19.99 美元,但它们提供的功能有所不同。这是一个快速细分:
| 特点 | ChatGPT Plus (OpenAI) | 双子座人工智能专业版(谷歌) |
| 每月费用 | 19.99 美元/月。19.99 美元/月。 | 主要型号 |
| GPT-5.4(即时和思考)。 | Gemini 3.1(快速、思考、专业)。 | 使用限制 |
| 每 3 小时最多 160 条消息; | 手动“思考”模式每周上限为 3,000 条消息。 | Pro 上最多 100 条消息,Thinking 上最多 300 条消息(限制根据需求而变化)。 |
| 上下文窗口 | 128,000 至 100 万个代币(因模型选择而异)。 | 100 万到 200 万个代币。 |
| 主要特点 | Sora(视频)、GPT Image 1.5(图像)、代理模式(包括在 Atlas 浏览器中)、第三方应用程序集成和自定义 GPT。 | Google Workspace 集成(包括 Chrome 和搜索)、NotebookLM、Canvas(幻灯片)、Veo(视频)、Lyria 3(音乐)、Nano Banana 2/Pro(图像)和自定义 Gems。 |
| 深入研究 | 包括 25 次运行/月。 | 包括 20 次/天。 |
哪个AI更准确?
两者通常都是准确的,但人工智能可能而且确实会犯错误。在我上面的测试中,两者似乎都没有为我提出的任何问题提供错误或误导性的信息。尽管如此,你还是应该始终进行事实核查。
