OC

Knowledge OS
鹦鹉螺口语
人工智能生产力悖论
2026-01-23 01:29:40 · 英文原文

人工智能生产力悖论

作者:Casey Newton

这是一个关于人工智能的专栏。我男朋友在 Anthropic 工作。参见 我在这里完整地披露了道德规范

当今科技领域最重要的开放性问题之一有一些令人惊讶的有趣答案。 

平均而言,在工作中使用人工智能会提高您的工作效率还是降低工作效率?

答案可能取决于您是经理还是工人。 

这可能取决于您正在使用哪些工具以及您使用它们的程度。 

但最重要的是,这可能取决于你是否在欺骗自己。

去年有关人工智能的最著名论文之一来自 METR,这是一家评估前沿人工智能模型的非营利组织。七月,它公布了结果一项研究经验丰富的开源开发人员的随机对照试验。研究发现,当他们使用人工智能工具时,完成任务需要 19%更长比他们没有的时候。这已经够令人惊讶的了。但真正的转折是,当这些开发人员被问及人工智能为他们做了什么时,他们报告说人工智能使他们的速度提高了 20%。 

最后,这些开发人员学到了我每次下载新的待办应用程序时都坚持要重新学习的同样的教训:感觉高效和高效是两件不同的事情。 

今天,当我读到人工智能咨询公司 Section 的一项新研究时,我想起了这些被欺骗的甜蜜开发人员。该组织对 5000 名白领进行了调查,了解人工智能是否提高了他们的效率。三分之二的普通员工表示,人工智能每周为他们节省了零到两个小时的工作时间。40% 的人表示他们会没事的——再也不会使用人工智能了。根据该研究的一个故事华尔街日报。但超过 40% 的高管表示,人工智能每周为他们节省了超过 8 个小时。

如何解释这种分歧? 

一种可能性是,这里的高管也陷入了与开源开发人员相同的陷阱。他们正在用双子座回复所有电子邮件;他们正在使用 ChatGPT 创建幻灯片;他们有五个克劳德代码代理在六个不同的监视器上运行,处理他们周末提出的不同项目。虽然这些工具输出了大量的东西,但企业本身并没有赚到更多的钱。

本周的另一项调查证实了这一解释。普华永道对 95 个国家的 4,454 名首席执行官进行的调查发现,12% 的公司表示人工智能增加了收入并降低了成本,但 56% 的公司表示他们正在获益 –没有任何结果. –

这是为什么呢?一种理论认为,人工智能的使用只是转移了组织周围完成任务的负担。的期刊引用名录Workday 的一项研究研究发现,员工报告使用人工智能工具节省的大部分时间都被对人工智能生成内容的扩展审查所抵消。当然,在许多情况下,是高管将人工智能生成的工作传递给下属,然后下属必须审查工作并纠正,然后才能实施。 

去年,我们为这种材料找到了一个令人难忘的术语:workslop。该术语指的是“人工智能生成的工作内容,伪装成好工作,但缺乏有意义地推进给定任务的实质内容”,正如 CNBC 报道9月份定义的

CNBC 发现大部分工作(约 40%)来自同行。但至少 16% 来自上面。它描绘了一幅令人难以抗拒的喜剧画面:一位睁大眼睛的高管使用他们可以使用的所有人工智能工具来创建错误百出的文件和计划,然后他们的下属必须花一半的时间来修复这些文件和计划。

其中一些归结于支撑人工智能的非确定性系统的不可靠性。其中一些也是技能问题。一个11 月普华永道调查近 5 万名员工发现,92% 的日常人工智能用户表示比同龄人的工作效率更高,58% 的人表示这增强了他们的工作保障,52% 的人表示这与更高的工资有关。当然,生产率的提高在一定程度上可能只是一种幻觉。但我怀疑并非全部都是如此。

特别是因为日常用户更有可能为最先进的模型和工具付费,而不是他们的电子邮件帐户附带的任何基本的微软或谷歌工具。

还有一个事实是,这些研究远远落后于人工智能本身的发展速度。例如,METR 研究中的开发人员主要使用 Cursor Pro 与 Claude 3.5 和 3.7 Sonnet。如果你换成 Claude Opus 4.5,这些数字会发生多少变化? 

我怀疑进一步的研究会回答这个问题。但与此同时,这里还有一个值得考虑的差距。 

管理者的原因之一感觉使用人工智能之所以如此高效,是因为他们从中受益。另一方面,工人们更有可能怀疑,有效地使用人工智能是为了帮助他们自己最终被人工智能工具取代。“虽然上行空间不明朗,但下行风险是显而易见的,对于一些担心自己工作保障的人来说,这些风险往往是生死攸关的。”布鲁金斯学会研究人工智能和劳动力的高级研究员莫莉·金德 (Molly Kinder) 通过电子邮件告诉我。“考虑到热情和动机的差异,如果生产率的提高直接来自于那里,我不会感到惊讶。”

她说,目前要求工人使用的许多工具的宣传速度仍然超过了其质量。 

“我认为,当工人们不断从雇主那里听到这些工具有多么出色,并且表达出对未来失业的恐惧时,这对他们来说尤其烦人,”金德说。

那么该怎么办呢?

管理者应该学会不要将自己的热情误认为是业务成果。仅仅因为他们发现使用人工智能工具很有趣,并不意味着组织会因此受益。他们最好专注于标准分析,而不是对人工智能未来进行更多基于振动的分析。

员工的情况更为复杂,并且根据公司、角色以及他们对人工智能的特殊感受而有很大差异。至少,我认为工作人员将受益于了解最先进的模型有多好(和有多坏),并随着新模型和工具的出现而更新这种理解。从短期来看,这可能会给他们在办公室带来更多影响力。如果他们的角色最终被取代,现在更好地了解情况可以帮助他们预见到这一点。 

因为尽管 METR 研究看起来很有趣,六个月后,创始人Node.js正在声明 –人类编写代码的时代已经结束至少对于软件工程师来说,锯齿状的前沿已经发展到足以吞噬他们大部分日常工作。曾经有一段时间,人工智能只是制造它们感觉就像他们很有生产力一样。但随着时间的推移,它确实做到了。

在本周的播客上:Kevin 和我探讨了广告将如何改变 ChatGPT 和 OpenAI。然后,Anthropic 的阿曼达·阿斯克尔 (Amanda Askell) 与我们一起讨论克劳德的新宪法。

奖金播客:在 YouTube 上,凯文和我录制了24 分钟的氛围编码教程对于那些想要开始的人。

苹果|Spotify|缝合器|亚马逊|谷歌|YouTube

赞助

不要追随你的激情

如果您想拥有充实的职业生涯,就不要“追随您的激情”。

80,000 Hours 是一家非营利组织,旨在帮助人们找到更有意义、更有影响力的职业生涯,并帮助解决世界上最紧迫的问题之一。在回顾了 60 多项有关梦想工作的要素的研究后,他们发现大多数常见建议(例如寻找高薪且无压力的工作)都站不住脚。

那么有什么作用呢?

在他们以研究为导向的职业指南中,他们认为,要拥有令人满意的职业,你应该做感觉有意义的工作,因为它有助于帮助他人。

此外,最常见的让世界变得更美好的方法并不像人们想象的那么有效:

  • 有些职业比其他职业具有更高的积极影响
  • 世界面临的最紧迫的问题往往是最容易被其他人忽视的问题
  • 因此,如果你想做好事,就不必遵循成为医生、教师或慈善工作者的传统道路。

他们的指南充满了具体、实用的建议,旨在帮助您制定一个令您充满信心的完整职业计划,并且它借鉴了 10 多年的研究成果。

正在关注

过度思考的思维机器

发生了什么:更多细节正在泄露思维机器实验室开放人工智能CTO 被解雇后巴雷特·佐夫他离开了前者,并与另外两名 TML 高级员工一起回到了后者。这个消息可以理解惊慌的Thinking Machines 投资者被要求支持 500 亿美元的新估值。

硅谷的人们对此很着迷,但也很困惑。一些人最初表示佐夫因“不道德行为”而被解雇,而另一些人则声称他被解雇是因为穆拉蒂得知他计划离开公司。从那时起,我们了解了职场恋情、高管之间的冲突、和更多 根据账目中的

华尔街日报纽约时报,米拉·穆拉蒂与佐夫的问题始于今年夏天,当时她得知佐夫与一位女同事有不公开的关系。Zoph 显然建议将那位同事招募到 TML;他们的恋情早在他们都在 OpenAI 时就开始了。 

佐夫最初否认了这种关系,但最终双方在今年夏天向穆拉蒂透露了这一点。该女子随后前往 OpenAI。据《每日邮报》报道,佐夫告诉穆拉蒂,他是“被操纵进入这段关系的”。期刊。(无论如何那个的意思。)

不久之后,佐夫休了一个月的假。当他回来后,穆拉蒂让他担任技术贡献者的角色,职责更有限。(佐夫告诉期刊这是技术经理的常见做法。)

与此同时,Zoph、联合创始人 Luke Metz 和研究员 Sam Schoenholz 越来越不同意 Murati 的公司计划,并认为与竞争对手相比,其发布的产品令人失望。当 Meta 发起收购 TML 的谈判时,出现了一个热点;佐夫希望穆拉蒂继续这笔交易,但她拒绝了。

然后上周,根据时代,三人出现在佐法安排的与穆拉蒂一对一的比赛中。他们要求佐夫对技术决策拥有最终决定权——穆拉蒂在公司拥有这一权力。

穆拉蒂询问这三人是否已经在其他地方工作了;舍恩霍尔茨和梅斯拒绝了,但佐夫拒绝回答。 

两天后,佐夫被解雇。几个小时后,三名 TML 员工加入了 OpenAI。此后,这家大约 100 人的初创公司中又有 9 名员工跳槽到 OpenAI 或获得了 OpenAI 的录用通知。佐夫现在将OpenAI 致力于向更多企业客户销售产品。

为什么我们关注:撇开八卦不谈,目前尚不完全清楚 Zoph 的离职是否更多地与职场恋情、对初创公司发展方向的分歧或其他原因有关。从表面上看,穆拉蒂解雇了佐夫,因为她已经知道他要离开。(或者也许一直在寻找这样做的借口。)

不过,如果我们掌握的细节是正确的,那么这场不幸的办公室爱情故事的两个参与者似乎又回到了 OpenAI。这可能会导致一些尴尬的走廊谈话。

至于Thinking Machines,如果多名联合创始人在几个月内离开,那可就不是什么好事。但关于公司最重要的问题不是这些员工为何离开。而是剩下的那群人能否

人们在说什么:– Thinking Machines Lab 在得知我将离开公司后才终止了我的雇佣关系。句号,”佐夫在给委员会的一份声明中说华尔街日报。“TML 从未向我提出任何绩效原因或任何不道德行为作为解雇我的理由,任何其他建议都是虚假和诽谤性的,”他补充道。

文基·加内桑,投资公司合伙人门洛创投,与大家分享了一些存在主义的反思时代消息传出后——我想起了这句话安娜·卡列尼娜:“幸福的家庭都是相似的;每个不幸的家庭都有自己的不幸,”他说。– 幸福的公司需要许多事情同时顺利进行。只要出现一两件事,你的公司就会不幸福。”

——埃拉·马基亚诺斯


Grok(和 Meta)的裸体规模

发生了什么:在一项新的分析中,纽约时报打击数字仇恨中心 估计的那个格罗克创作并公开分享了至少 180 万张女性性感图片。这意味着在短短 9 天内公开发布的 440 万张图像中,至少 41% 可能包含这些图像。

另外,CCDH 估计 Grok 创作的超过 23,000 张描绘儿童的色情图像。 

格罗克是迄今为止这个领域最差的演员。但同时尽管人工智能不允许用户创建像 Grok 那样的图像,但该公司仍在通过像 Grok 这样的人工智能“裸化”应用程序来赚钱。安审计通过指标Meta 发现,尽管去年 6 月承诺打击裸露广告,但自 12 月 4 日以来,Meta 在其各个平台上至少投放了 4,431 个裸露广告。(Meta 发言人表示,该公司正在审查和执行针对违规广告的政策。)

这个“好”消息,指标— 的亚历克西斯·曼扎里斯指出的一个问题是,有些广告似乎是针对应用程序的骗局,实际上不会裸体。人们很难对那些试图制作 Deepfake 裸体的人抱有太多同情,但令人遗憾的是 Meta 无论如何都从交易所中获利

为什么我们关注:世界各地的监管机构正在考虑社交平台带来的前所未有的滥用规模。 

而虐待行为的罪魁祸首,X和它的主人埃隆·马斯克,一再拒绝甚至承认这个问题。就在上周,马斯克他不知道 Grok 生成了任何裸体的未成年人图像。从字面上看是零,X 只是表示,在几周的强烈反对之后,它将阻止此类图像的生成。

人们在说什么:“这是对妇女和女童的工业规模虐待,”伊姆兰·艾哈迈德CCDH 首席执行官告诉时代,指出了 Grok 独特的易用性和分发性。

曼扎里斯告诉英国广播公司 (BBC) 去年表示,“这种滥用媒介需要研究人员和媒体持续监控,以确保平台承担责任并限制这些有害工具的影响范围。”

– 林赛·朱 (Lindsey Choo)

支线任务

抖音据报道,交易是设置为关闭本周,但希望它可以违宪地再延长几个 90 天。

一个房子委员会已批准立法寻求国会对先进芯片销售进行更多监督中国. . . 

中国如何网信办 追踪并成长国内人工智能热潮。我们拥有什么学到了深度搜索一年后,人工智能带来了冲击。如何美国而中国有合作的关于人工智能研究。声称中国在人工智能方面落后于美国的说法纯属“童话”米斯特拉尔首席执行官亚瑟·门施

开放人工智能 它将支付所需的能源成本星际之门在因推高当地社区公用事业费用而遭到强烈反对后,基础设施建设受到了强烈反对。据报道 OpenAI开始提供 聊天GPT向广告商投放广告,并要求支出承诺不超过 100 万美元。首席执行官萨姆·奥特曼会见据报道,该轮融资总额至少为 500 亿美元。的盖茨基金会和开放人工智能计划投资5000 万美元用于利用人工智能缓解非洲诊所的人员短缺问题。一个谈话与前 OpenAI 研究员杰里·特沃雷克关于他离开的原因。

人择重写 克洛德— 新宪法中的指导原则。据报道,Anthropic 的收入运行率增加了一倍多自去年夏天以来,这一数字到 2025 年将达到 90 亿美元以上,尽管降低其毛利率预计为40%。一个看看在用电量从克劳德·科德会议。

韩国 介绍一系列监管人工智能的法律引起了初创公司的强烈反对。

快照 定居社交媒体成瘾诉讼——针对 Snap 的几起诉讼中的第一起,,抖音YouTube。它介绍和解两天后新的家长控制。

加拿大法院推翻了下令关闭该国的 TikTok。

X 介绍入门包,— 您可能会认为它是 — 的模仿者入门包— 由蓝天。安人工智能工程师离开该公司在讨论了 xAI 的一些粗略内部运作之后,似乎未经许可。一个

问答严乐存他对法学硕士的赌注。

超级智能实验室CTO 本月在内部交付了第一个关键模型安德鲁·博斯沃思 监督委员会 将审查关于 Meta 如何决定禁用帐户的案例(很好!)。线程数扩大向全球所有用户投放广告。

超过800个创意支持的一项名为“的反人工智能运动”偷窃不是创新.··· 

谷歌深度思维据报道有雇用初创公司的首席执行官和几位工程师休谟人工智能,在最新的黑客调查中。谷歌— 的人工智能模式 现在可以使用邮箱谷歌照片以获得更个性化的回复。英国广播公司合伙的与 YouTube 合作,为该平台制作原创内容。YouTube 首席执行官尼尔·莫汉 发誓在他的年度信中与人工智能作斗争——他还在其中创作者将能够在人工智能生成中使用自己的肖像短裤

韦莫 推出它的机器人轴在迈阿密

苹果 击败声称其违反加利福尼亚州涉嫌从内部应用程序收集数据时的隐私法。西里据报道将变成Apple 首款人工智能聊天机器人 — 由双子座– 并深深嵌入到各种操作系统中。据报道,苹果公司发展中一个航空标签大小的 AI 引脚。一个看看在软件主管克雷格·费德里吉— 人工智能的行动。

一名法官禁止的 卡尔希从经营体育博彩马萨诸塞州

人工智能代理对安全应用程序构成威胁,例如信号,信号基金会总统梅雷迪思·惠特克

安娜的档案貌似迷失了多个域名因为Spotify诉讼。

子栈 推出电视应用程序苹果电视谷歌电视

学院正在使用人工智能机器人帮助决定他们应该录取谁。消费者花费更多到 2025 年,在非游戏应用程序(如人工智能应用程序)上的应用将多于游戏应用程序。人工智能天气模型的原理制作预测更准确。

那些好帖子

每天有更多好帖子,关注 Casey 的 Instagram 故事

(链接

(链接

(链接

与我们交谈

向我们发送提示、评论、问题和工作:凯西@platformer.news。阅读我们的道德政策在这里

关于《人工智能生产力悖论》的评论

暂无评论

发表评论

摘要

在工作中使用人工智能不一定会提高生产力;研究结果表明,虽然一些高管声称效率显着提高,但许多普通员工表示,使用人工智能工具时,效率几乎没有提高,甚至任务完成时间更慢。这种差异归因于工具不可靠性、用户之间的技能问题以及跨组织级别的工作审查和纠正负担的潜在转移等因素。此外,人们担心员工担心人工智能最终会取代他们,从而影响他们对生产力的看法(与管理层的观点相比)。