英语轻松读发新版了,欢迎下载、更新

程序员担心这家价值 20 亿美元的初创公司的人工智能会取代他们的工作

2024-12-02 11:30:00 英文原文

作者:Rashi Shrivastava

这个故事出现在《福布斯》杂志 2025 年 12 月/2025 年 1 月号上。订阅

在 2 亿美元资金的支持下,28 岁的 Scott Wu 和他在 Cognition 的竞争性程序员团队正在构建一种可以完全自行编程的人工智能工具,就像一支“初级工程师大军”。

经过拉什·施里瓦斯塔瓦理查德·尼瓦, 福布斯员工


J就在圣诞节之前2023 年,Cognition 的小团队正在努力为这家位于旧金山的人工智能初创公司初出茅庐的编码助理 Devin 设置一个特别复杂的数据服务器。他们花了几个小时仔细研究安装文档并尝试不同的命令,但就是无法让它工作。又累又沮丧,他们决定看看德文会如何处理。

当人工智能开始行动时,它的创造者感到困惑。“它运行着最具巫术、看起来像黑魔法的命令,”21 岁的联合创始人兼产品负责人 Walden Yan 回忆道。有一段时间,德文似乎不会比他们做得更好。然后,连续几个小时呈红色的服务器终端灯变成了绿色。数据服务器已启动并正在运行。

科迪·皮肯斯登上《福布斯》

他们意识到,德文删除了团队忽略的一个有问题的系统文件。“就在那一刻,我真正意识到软件工程将会发生多大的变化,”Yan 说。

这是 Devin 完成的第一项重大任务,也是 Cognition 愿景的概念证明,即人工智能将繁琐的编码工作从编码中解放出来。现在,差不多一年后,德文正在处理基本的工程工作——发现和修复错误、更新代码块并在平台之间迁移它们。给它一个简单的提示——清理这个代码库——它就会创建一个行动计划并执行它。大多数时候,它是有效的。

这与这个新兴领域中其他更知名、更大的参与者不同,例如 Github(微软于 2018 年以 75 亿美元收购)和价值 13 亿美元的 Codeium,这两家公司都提供帮助人们的数字助理使用人工智能支持的建议编写代码。但 Devin 是一个自主的 AI 代理,从理论上讲,它自己编写代码(无需人员参与),并且可以完成通常分配给开发人员的整个项目(Devin 这个名字来自“dev”,是“dev”的缩写)。学期)。“我们看到的是一个真正的机会”,28 岁的 Cognition 联合创始人兼首席执行官 Scott Wu 说道,“从文本完成转向任务完成。”

人工智能生成的代码已经开始重塑这个行业。10 月份,谷歌首席执行官桑达尔·皮查伊 (Sundar Pichai) 表示,这家科技巨头超过四分之一的新代码是由人工智能编写的。微软首席执行官萨蒂亚·纳德拉 (Satya Nadella) 在 7 月份表示,Github 的年运行率将在 2024 年达到 20 亿美元,其代码完成工具已占今年收入增长的 40%。Pitchbook 分析师 Brendan Burke 表示,AI 编码已成为生成型 AI 领域资金最多的用例,专注于该领域的初创公司仅在 2024 年上半年就筹集了超过 10 亿美元的资金。

“现实世界中的软件工程非常混乱。”

实际收入才刚刚开始增长:研究公司 IDC 预计,到 2029 年,其收入将仅超过 40 亿美元。多家 AI 编码初创公司的年收入运行率已超过 1000 万美元;Cognition 拒绝分享收入,但总裁拉塞尔·卡普兰 (Russell Kaplan) 表示,该公司已与数十家客户签约,典型的年度合同金额为六到七位数。但这个机会足够令人兴奋,以至于像 Anthropic、亚马逊和 IBM 这样的巨头,以及像 Poolside(估值 30 亿美元)和 Anysphere(估值 4 亿美元)这样的初创公司,都推出了自己的编码工具。IDC 分析师 Ritu Jyoti 表示,编写代码的能力已经成为典型 AI 模型的“赌注”,他指出该领域的领导者仍然是 OpenAI 的 ChatGPT。但是,像 Cognition 正在开发的那样,对可以完全独立工作的人工智能进行编码,将会带来翻天覆地的变化。”

对于 500 万美国程序员(年薪中位数为 13 万美元)来​​说,这可能不是什么好消息,更不用说印度和中国的 1300 万程序员了。吴坚称,大规模失业不会迫在眉睫,该领域已经“受到供应限制”。

日常程序员可能会很谨慎,但投资者喜欢它。Peter Thiel 的 Founders Fund 和 Khosla Ventures 押注于 Wu 和他的 25 名团队,在 4 月份的 B 轮融资中向 Cognition 投资了 1.76 亿美元,在其成立仅六个月后,该公司的估值就飙升至 20 亿美元。该公司在 1 月份完成了 2100 万美元的 A 轮融资后仅三个月就获得了现金注入。

其客户包括 3 亿美元(2023 财年收入)的费用管理公司 Ramp,该公司使用它来编写测试和清理死代码,以及 17 亿美元(2024 财年收入)的数据平台 MongoDB,Devin 为其更新过时的代码架构,从而节省了客户的时间首席产品官 Sahir Azam 表示。价值 80 亿美元(2023 年收入)的金融科技公司 Nubank 的程序员正在使用它来执行更新代码存储库等任务。

现在还处于早期阶段,但 Founders Fund 合伙人 John Luttig 投资 Cognition 的部分原因是他认为 Cognition 拥有足够的领先优势,“在编码代理方面要赶上他们将非常困难。”微软似乎有类似的预感。该公司于 5 月份签署了合作伙伴关系,在其 Azure 云上向开发人员提供 Devin,首席技术官 Kevin Scott 在公司年度开发人员大会上称赞它是“非凡”的工具。

但硅谷到处都是那些曾一度领先于亚马逊和谷歌的公司,直到它们不再领先。认知的支持者们打赌,如果有人能够创造出终极编码机器,那就是三位世界级的编码员并获得了荣誉来证明这一点。创始人都是在编程竞赛中认识的奥林匹克级金牌编码员。吴是一名小学数学高手,在举办编程竞赛的程序员网站 Codeforces 上拥有“传奇大师”排名(最高)。Cognition 天使投资人兼 Ramp 首席执行官埃里克·格莱曼 (Eric Glyman) 表示,吴的智商是我见过的“智商前五名”之一。

“斯科特显然才华横溢、好奇心强、野心勃勃,”风险投资家莎拉·郭 (SarahGuo) 说,她通过自己的公司 Conviction 对 Cognition 进行了三轮融资。Wu 也是《福布斯》30 位 30 岁以下精英人物:他于 2019 年凭借其之前的公司 Lunchclub 上榜,该公司使用人工智能来预订社交会议。一位 Cognition 投资者告诉福布斯吴于 2022 年离开,因为他的兴趣转移到了其他地方(吴拒绝置评),而已筹集约 3000 万美元的 Lunchclub 仍在艰难前行。“可能的炒作与可靠的工作之间始终存在差距。”

Cognition 在三月份推出了 Devin,引起了广泛关注。

在一段在 X 上获得了 3000 万次观看的演示视频中,该公司声称 Devin 已经“成功通过了领先人工智能公司的实际工程面试”,并完成了杂乱的编码任务。一些工程师对德文的技术能力感到震惊;其他人担心自己的工作。发布后不久,一段七年级学生吴在数学竞赛中占据主导地位的视频重新出现,在线评论员开玩笑说,“他不是人类,他是人工智能”,“德文只是斯科特在消息中回答你的问题”应用程序。 –

随后,来自德克萨斯州奥斯汀的知名独立开发者卡尔·布朗称这是恶作剧。在一段观看次数超过 50 万次、名为“揭穿 Devin 真相”的视频中,他指责 Cognition 过度推销其人工智能工程师。他的审查发现,德文完成这项工作所花费的时间比人类要长得多,并且在此过程中引入了错误。

类似的经历让一些人质疑德文是否只是被吹进人工智能炒作泡沫中。数据标签公司 Labelbox 的工程师 Krish Manair 测试了该工具的网络应用程序创建技能,他说,要求它设计引人注目的用户界面,结果很单调。几位竞争对手的创始人告诉福布斯他们认为公司对 Devin 的能力承诺过高,看起来工程师可以直接使用 Devin 来编写任何代码。他们认为,其当前的功能要狭窄得多,并且面向清理现有代码等预定义任务。在现场演示中,福布斯促使 Devin 开发了一款用于调音吉他的应用程序。它在大约 10 分钟内就完成了一个任务,但该应用程序无法正确识别测试时演奏的音符,Cognition 的创始人也不确定原因。竞争对手编码初创公司 Codeium 的首席执行官瓦伦·莫汉 (Varun Mohan) 表示,“对可能性的炒作与可靠的工作之间总是存在差距。”

吴承认德文远非完美。“现实世界中的软件工程非常混乱,”他在俯瞰旧金山湾的创始人基金总部说道。“人类总是会编写错误。”公平地说,许多批评者对该工具的功能印象深刻。Wu 声称,自推出以来的七个月里,Devin 取得了显着的进步,部分原因是早期企业客户的反馈,他们似乎接受了该代理作为一项正在进行的工作。“我们并不认为这个工具有什么神奇之处,”Nubank 首席技术官 Vitor Olivier 说道。“我们持谨慎乐观的态度。”他说,在某些情况下,能够接触到 Devin 的工程师的工作速度提高了八倍。

认知继续进行实验。今年早些时候,它让德文能够启动下级人工智能来帮助它。但当 Cognition 测试这种新的“经理”模式时,它发现下级 Devins 会启动自己的下属,而下属又会启动更多的下属,从而形成一个巨大的、永无休止的人工智能官僚循环。“我们最终不得不取消这项工作,因为他们不断委派工作,”卡普兰说。

也就是说,卡普兰指出,当多个开发人员同时从事不同的项目时,该工具效果最好,就像一支“初级工程师大军”。这句话可能会让一些以编码为生的人感到不舒服,而吴表示,对认知的一些负面情绪来自于对人工智能是否会抢走软件工程工作岗位的焦虑。他认为,德文可以让公司开展更多项目,雇佣人类来做更有意义的工作。

“确实存在很多恐惧,”他说。“人们对于这个新范式中会发生什么有很多疑问。”

更多来自《福布斯》的内容

福布斯在特朗普关税下,“越南制造”将成为新的“中国制造”经过赛勒斯·法里瓦尔福布斯泽西·迈克的亿万富翁创始人及其超受欢迎连锁店的内幕故事经过杰米玛·麦克沃伊福布斯福布斯 CIO 下一个名单:2024经过理查德·尼瓦福布斯如果特朗普不阻止的话,水力压裂热岩可能会彻底改变清洁能源经过克里斯托弗·赫尔曼福布斯如何保护您的债券免受通胀卷土重来的影响经过威廉·鲍德温

关于《程序员担心这家价值 20 亿美元的初创公司的人工智能会取代他们的工作》的评论


暂无评论

发表评论

摘要

Cognition 的 Devin 是一名人工智能工程师,旨在承担复杂的编码任务,但其能力却面临着批评和怀疑。以下是文章的要点:### 关于 Devin 的要点:1. **技术能力**:- **最初的热潮**:Cognition 于 2023 年 3 月推出了 Devin,并通过一段演示视频展示了它通过了领先人工智能公司的实际工程面试。- **褒贬不一**:一些工程师对 Devin 的技术实力印象深刻,而另一些工程师则质疑其可靠性和效率。2. **批评**:- **Carl Brown 的揭秘视频**:一位独立开发者批评 Cognition 夸大了 Devin 的能力,强调完成任务所需的时间比预期更长,并且引入了错误。- **狭窄的功能**:竞争对手认为,Devin 目前专注于清理现有代码等预定义任务,而不是广泛的工程角色。3. **展示的性能**:- **Web 应用程序创建**:一位工程师发现该工具的 Web 应用程序创建技能令人印象深刻,生成的界面单调且效率较低。- **吉他调音器示例**:在现场演示中,Devin 构建了一个吉他调音器,但未能准确识别演奏的音符。4. **改进**:- **企业反馈**:早期企业客户提供的反馈使 Devin 的性能随着时间的推移不断提高。- **当前功能**:Nubank 的 CTO 注意到了显着的进步,工程师在使用 Devin 时工作速度提高了八倍。5. **实验和挑战**:- **从属人工智能**:认知测试允许德文启动从属人工智能来提供支持,但遇到了诸如人工智能委托无限循环之类的问题。- **最佳使用**:该工具最适合多个 Devins 同时处理不同的项目,类似于“初级工程师大军”。### Scott Wu 的观点:1. **承认不完美**:- 吴承认德文并不完美,人类工程师也会犯错误。- 他认为这是一项正在进行的工作,而不是一个完全成熟的解决方案。2. **未来采用的愿景**:- Wu 认为 Devin 将使公司能够开展更多项目,从而有可能减少对平凡任务的人力需求,但雇用人员从事更高级别、更有意义的工作。3. **解决问题**:- 他认识到人们对人工智能接管软件工程工作的巨大恐惧和怀疑。- Cognition 旨在将 Devin 定位为提高生产力而不是取代人类工程师的工具。### 结论:尽管 Devin 展现了前景并赢得了企业客户的青睐,但它的可靠性和实际应用仍面临着持续的审查。为了满足其最初的宣传所设定的期望,该工具需要不断的改进和完善。Cognition 旨在将 Devin 视为人类工程师的补充资产,而不是替代品。这种微妙的观点强调了人工智能在工程任务中的潜力和局限性,强调了现实期望和持续发展的重要性。