光标更擅长营销而不是编码
意见AI集成开发环境(IDE)公司Cursor最近隐含的它几乎完全用人工智能代理构建了一个可用的网络浏览器。我不会说他们撒谎,但首席执行官迈克尔·特鲁尔肯定发推文:“我们在 Cursor 中使用 GPT-5.2 构建了一个浏览器。”
他接着说道:“这是跨越数千个文件的 300 万多行代码。渲染引擎是用 Rust 从头开始的,具有 HTML 解析、CSS 级联、布局、文本整形、绘制和自定义 JS VM。”
这听起来令人印象深刻,不是吗?他还补充道:“这*有点*有效”,这并不是最响亮的认可。尽管如此,许多新闻来源和社交媒体喋喋不休地报道了这样的消息:AI 在一周内构建了一个网络浏览器。
可惜这不是真的。如果你真的看过 Cursor 工程师 Wilson Lin 的博客文章快速渲染,人工智能创建的网络浏览器,你不会看到太多关于一个有效的网络浏览器的夸耀。相反,有一个网络浏览器工作的视频,以及一个不太积极的说明“从头开始构建一个浏览器非常困难”。
在 GitHub 上发布这样的软件公告的原因是,虽然头条新闻正在宣布人工智能的又一次胜利,但开发人员却有这种令人讨厌的伎俩。他们实际上 git 代码并尝试一下。
开发人员很快发现“浏览器”几乎无法编译,经常不运行,并且在营销中被严重歪曲。
作为一名技术人员,关于他们如何尝试但没有真正成功的实际博客文章更有趣。当然,Cursor 运行了数百个 GPT-5.2 风格的代理,运行一周生成了 300 万行新代码,最多从头开始生成一个半功能性的 Web 浏览器,这并不算是一个好标题。
根据我选择的人工智能聊天机器人 Perplexity 的说法,本周持续的自主浏览器实验消耗了大约 10-20 万亿个代币,按当时前沿模型的当前标价计算,将花费数百万美元。
我自己刚刚克隆了一个 Chromium 的副本,尽管花费了那么多时间和金钱,克隆该存储库的独立开发人员报告说,代码库距离功能性浏览器还很远。最近的提交不能完全编译,GitHub Actions 运行于主要失败了,审阅者找不到最近构建的没有错误的提交。
在手动修补后构建成功的情况下,性能非常糟糕,页面报告需要大约一分钟才能加载,并且严重依赖现有项目,例如伺服,一个基于 Rust 的 Web 渲染引擎,以及 QuickJS,一个 JavaScript 引擎,尽管声称是“从头开始”。
Lin 在 Y Combinator 上为该项目辩护,说,例如:“JS 引擎使用了在供应商/ecma-rs 中开发的自定义 JS VM 作为浏览器的一部分,这是我个人 JS 解析器项目的副本,以便更容易提交。”如果它是从他个人的 JavaScript 解析器派生的,那并不是真正的从头开始,不是吗?从争论的声音来看,它也不是人工智能写的。
- 仅仅因为 Linus Torvalds 的氛围代码并不意味着这是一个好主意
- Microsoft 365 Copilot 应用程序的品牌重塑很糟糕,但还有更糟糕的罪犯
- 最耐用的技术是无聊的、陈旧的,而且无处不在
- Linux 桌面真正需要什么来挑战 Windows
Gregory Terzian,Servo 维护人员,回应了:“实际的代码更糟糕;我只能将其描述为一团意大利面条......我无法从中获得太多(如果有的话)。”然后他给出了讽刺性的赞美:“所以我同意这不仅仅是连接依赖关系,也不是从现有实现中复制:这是一个独特的糟糕设计,永远无法支持任何类似于现实世界的 Web 引擎的东西。”现在那是烧伤。
从我的立场来看,Cursor 案例比失败的黑客周项目更危险的是,炒作融入了其方法论。这个“实验”并没有呈现出它真正的样子:一个有趣但混乱的内部学习练习。不,它的推出是一个里程碑,方便地证实了该公司长期运行的自主代理广告。这个故事缺少任何高级工程师都需要的基础知识:通过持续集成(CI)、可重复的构建以及显示浏览器不仅仅是一瘸一拐地浏览一个 hello-world 页面的真实基准测试。
缩小范围后,首席执行官们仍然预测人工智能将在一年内编写 90% 的代码,而大多数企业人工智能试点仍然无法带来有意义的投资回报。
对于开发人员来说,我们现在正处于人工智能恐怖谷之中。当然,像 Cursor 这样的工具作为美化的自动完成和重构助手确实很有帮助,但营销部门一直坚持初级工程师可以完成从规范到交付的整个项目。当您开始相信自己的精彩卷轴时,您就不再需要进行将演示与可交付成果分开的繁琐验证工作。
已经够了。炒作已经变得冷淡。OpenAI 首席财务官 Sarah Friar 最近在博客中表示,到 2026 年,其重点将是“实际采用”。让我们先看看现实世界的实际结果,然后我们才能讨论人工智能的实际应用。®