最近在 X(Twitter)上看到一位用户的观察,引发了不少讨论。
#观察 用了一段时间后的感受:Gemini 3对语言的理解能力特别垃圾,和ChatGPT差的很远。
https://x.com/fxtrader/status/2008542066301919268
其实有不少人说,Gemini 明显不如 ChatGPT。
这个判断本身并不离谱。
也有很多人觉得 Gemini 早就秒杀了 ChatGPT。
但我一直觉得,这类讨论里有一个经常被忽略的维度——
高级用户和普通用户,对同一个 AI 工具的“体感”,其实是完全不同的。
而且现在,普通用户已经开始意识到这一点了。
一、高级用户说“好用”,并不等于你会觉得好用
-
你用特别精巧、结构化、约束明确的提示词
-
你知道如何拆任务、控上下文、重开对话
-
你清楚它擅长什么、不擅长什么
在这些前提下,Gemini 的表现非常强,甚至可以说“惊艳”。
这也是为什么:
-
Prompt 高手
-
AI 重度使用者
-
技术型、高频调教模型的人
会对 Gemini 评价很高。
但问题在于——
这并不是大多数用户的真实使用状态。
二、普通用户的体感,更多来自“泛化能力”
对普通用户来说,他们在乎的不是:
-
这个模型在 benchmark 上赢了多少分
-
在极限提示词下能不能多榨出 10% 的性能
他们在乎的是:
-
我一句普通人说的话,它能不能听懂
-
我不想写提示词模板,它能不能直接帮我把事办了
-
我今天、明天、下周用起来,是不是都稳定
而在这件事上,ChatGPT 的优势非常明显。
这不是模型“聪不聪明”的问题,而是:
语言理解 + 服务经验 + 泛化能力
ChatGPT 在真实世界中,被无数“不规范、不专业、不成体系”的问题反复折磨过,它已经非常擅长应对这种日常、模糊、非理想输入。
这恰恰是普通用户最多的输入形态。
三、挫折感,是普通用户流失的最大杀手
一个很现实的现象是:
-
高级用户觉得 Gemini 很强
-
普通用户上手后,却很容易产生挫折感
原因很简单:
同样一句话,高级用户会下意识“补完”成一个可被模型理解的任务,而普通用户不会。
于是就会出现:
-
“它怎么老是理解偏?”
-
“是不是我不会用?”
-
“为什么别人说好用,我用起来这么累?”
这不是用户的问题,是泛化不足带来的体验落差。
四、现在,普通用户开始“不盲从”了
我觉得一个很重要的变化是:
普通用户正在从“听高级用户推荐”,转向“根据自己日常判断工具”。
他们开始意识到:
-
如果一个工具能把我每天 80% 的琐事做好
-
那我不会因为“另一个工具在 20% 的高级场景更强”,就轻易迁移
因为迁移是有成本的。
五、哪怕都是 LLM,工作流的差异也是真实存在的
这是很多技术讨论里被严重低估的一点:
哪怕都是大语言模型,用法和工作流依然存在显著差异。
包括但不限于:
-
对话节奏
-
上下文稳定性
-
是否需要频繁重开 Chat
-
对模糊指令的容忍度
-
是否要“伺候模型”
有时候,哪怕你切换到了一个理论上更强的工具,
你原有的日常工作流,也需要重新匹配、重新适应、重新形成肌肉记忆。
而普通用户,对这件事的容忍度是很低的。
六、关于 Gemini 的真实使用体验
我自己的体验也很一致:
-
Gemini 在某些任务里非常强
-
但聊多了之后,容易出现理解漂移
-
一个很常见的解决方案是:果断新开一个对话
这能解决问题,但也说明:
它目前对长对话、日常连续使用的稳定性,还不够“傻瓜化”。
七、当然,nano banana 是神器
这一点我必须单独说清楚。
nano banana 真的是神器。
-
对设计工作来说
-
对图像理解、生成、修改来说
它的吸引力非常大,甚至是压倒性的。
所以现在:
我主要的设计工作,几乎都交给 nano banana。
这是我真实、且非常明确的选择。
八、但日常文字,我依然选择 ChatGPT
与此同时:
-
写文案
-
改说明
-
整理思路
-
日常沟通、表达、推敲
我依然以 ChatGPT 为主。
不是因为它“更先进”,
而是因为:
它更稳定、更懂人话、更适合高频日常使用。
结语:工具不是比赛,选择是现实
Gemini 很好,nano banana 甚至是“现象级”的存在。
但这并不意味着:
-
普通用户必须立刻迁移
-
ChatGPT 就“过时了”
对大多数人来说:
只要一个工具,能把我的日常事务做好,我就不会轻易换平台。
真正成熟的使用方式,不是“站队”,而是:
-
设计 → 用最强的工具
-
日常 → 用最顺手的工具
多模型并行,才是目前现实世界的最优解。