英语轻松读发新版了,欢迎下载、更新

在AI时代,堆栈溢出如何增加人类答案的价值

2025-03-30 12:00:00 英文原文

作者:Written by Tiernan Ray, Senior Contributing Writer March 30, 2025 at 5:00 a.m. PT

prashanth-chandrasekar-close-up

Stack Overflow首席执行官Prashanth Chandrasekar。

Tiernan Ray

问答站点堆栈溢出成立于17年前是为了允许程序员 -人类程序员 - 发布有关编程问题的问题并从一个志趣相投的个人社区中获得答案。” 

自成立以来,全世界都对Chatgpt和其他生成A​​I程序的方式感到迷惑不解,不仅可以提供答案,甚至可以执行工作本身,向您递给您自己的自定义代码。

共享知识的人应该如何应对AI自动化的突然吸引力?

Stack Overflow的首席执行官Prashanth Chandrasekar已经经营了将近六年的公司 - 他有一个计划。我本月与他坐下来,了解该计划是如何结合在一起的。

还:什么是堆栈溢出?所有代码的论坛

Chandrasekar告诉我:“情况发生了变化;我们想随着时代的变化。”“我们想沿着河流的方向前进。”

chatgpt的兴起

他真的没有选择。从2022年开始, Chatgpt的兴起``对Stack Overflow的公共场地流量产生了直接影响,该广告占其收入的很大一部分。 

人们来堆叠溢出的主要方式始终是Google搜索。正如Chandrasekar所说,在Google上付费的搜索是“堆叠溢出的用户界面”。

能够问聊天机器人而不是迅速搜索到这些Google查询中,流量开始下降。 

Chandrasekar得出了关于AI和自动化的广泛哲学结论,而且还得出了互联网。

他说:“我们的观点是互联网的本质已经改变。”它不再主要是从人类查询中付费搜索的驱动现场流量。他观察到:“用户界面已更改为Gen AI工具。”

“因此,我们必须对该行业的变化做出尽可能多的反应。我们还需要多样化”作为财产。

另外: 堆栈溢出与Reddit和Twitter一起向AI公司收取培训数据

Chandrasekar和Team意识到Stack Overflow的6000万个答案有很多价值,可以解决生成AI的缺点。一种选择是起诉Openai和AI基础模型的其他制造商。“预训练”的大语言模型包括堆栈溢出对话,从法律上讲,它们是堆栈溢出的属性。

“我们说,好吧,我们可以做到这一点,或者我们可以做一些事情,例如,相对于其他人在做什么,是新颖的。” 

堆栈溢出安装的代码没有提起诉讼,以阻止对公共网站的刮擦,然后我们说,'如果您要建立一个聊天机器人或其他任何东西,就必须与我们合作。让我们达成公平的商业协议。''

知识作为服务 

除了广告和付费企业版的Stack Overflow(称为团队)之外,Chandrasekar正在建立第三个收入来源,称为知识解决方案,或知识 - 服务。

Chandrasekar曾经签署协议以许可堆栈溢出的内容,首先与Google和Openai。 

在过去的18个月中,他还忙于签署“所有的云高标准,我不能命名,但你知道它们。”“我们正在做更多的事情。”

这些交易包括与Microsoft的Visual Studio代码工具,GitHub Copilot和Google Gemini Code Assist的集成,以在编程环境中获得答案。

“所有这些公司都在服用,利用我们数据集的官方许可版本训练其模型进行预培训,以便在某些情况下进行抹布和索引之类的事情。”

还:AI机器人刮擦您的数据?这种免费工具使那些讨厌的爬行者逐步划定

答案在CHATGPT或其他LLM上浮出水面,并具有信用额,并链接回堆栈溢出。他说:“目标是实际重新接收人们直接向我们网站提供的流量。”“我们越来越成为一个无头的网站:如果人们将所有时间都花在AI Gen Bots上,那也很好。”

当然,如果实际上不在堆栈溢出网站上,则有与最终用户没有直接关系的风险。Chandrasekar表示,该公司有各种协议,可以从Openai和其他有关诸如聊天机器人用户使用的提示之类的信息中获取相关信息。 

他告诉我:“伴侣与我们之间的订婚中有很多微妙的事情。”他说:“我们正在处理每种情况。”例如,LLM的“上下文窗口”(最近的聊天记忆)与堆栈溢出共享。

AI的缺点

Chandrasekar说,Stack Overflow正在解决Openai和其他巨头技术的三个主要缺点。

还:为什么缩放代理AI是马拉松,而不是冲刺

一个缺点是他所说的信任点。“你不相信它会发生什么,”臭名昭著的LLM幻觉和纵容。一个 

第二个缺点是LLM脑排水。“如果您不生成新信息,这些LLM将不会在其智能水平上进步,”从可能污染LLM的所谓合成数据的争议中可以明显看出。

Chandrasekar说,最后,也许最重要的是,“ AI的答案实际上不是知识。”他说:“可能会有一个答案,但它们可能会因复杂性而被淘汰,因为这对一系列情况来说太复杂了。” 

团队集成 

同时,他已经与巨人公司达成了公共堆栈溢出的交易,Chandrasekar已经开始了知识解决方案业务的第二部分。堆栈溢出将其公共内容集成到团队产品对于想要扩展其内部知识资源的公司,以代理AI的目的。

引入了团队产品,因为公司表示他们希望自己的堆栈溢出作为存储库,而不是用于一般编程知识,而是用于特定的公司流程。Chandrasekar说,现在,同一公司希望扩展该信息池,因为他们想开发不仅仅是编程的AI代理。

“我们有像Uber这样的公司,实际上已经与我们一起做了这项工作,他们在这里建立了一个称为助手的AI聊天机器人,或者在非常慷慨的意义上是代理人,因为这是为了执行行动。但是,那个代理人正在利用团队的数据来获得类似的事情,例如,我们在Uber内部如何做到这一点?合适的时间。”

另外: 堆栈Overflow CTO:从自举到缩放网络的最大属性之一

换句话说,代理AI自动化员工传统上与团队的关系。“我们注意到了这一点,因为我们的API是红热的;我们的API被机器人不断击中。”

鉴于这种趋势,Chandrasekar正在为团队添加一个新元素,将整个堆栈溢出公共网站数据许可给同一团队客户。

“我们说,'为什么我们不采用我们的知识解决方案产品,公共平台数据,并将其与团队数据一起提供给公司?'然后,代理商可以从6000万个问题和答案中获得知识,以及公司特定的所有知识,然后在正确的时间得到正确的答案。”

团队产品(例如大型许可交易)都集成到各种产品中,例如Atlassian的Jira IT票务系统。

Stack Overflow正在与企业团队用户协商许可条款。Chandrasekar拒绝讨论定价细节,而不是说“这是一个基于价值的定价模型”。 

还:Vibe编码的真正承诺和危险的10位专业开发人员

他说:“这是早期阶段。” 

网站增强功能

•随着知识解决方案的开发,公共堆栈溢出站点正在获得一些相当重要的增强。” 

Chandrasekar说,该公司仍在“回到我们的交通水平”,没有透露流量号,而是“尚未完全”添加该网站“尚未完全”使其恢复到茶几前的水平。

Chandrasekar正在建立公共场所的功能,以使其更加实时。 

传统的堆栈溢出模式是一个人发布问题,然后发布他们建议的答案。 

其他两种形式的交流形式被埋葬在网站深处 - 聊天和讨论。Chandrasekar将它们描述为“游泳车道”的互动模式,这些模式无法提供主要堆栈的完美 - 溢出答案 - 但可以更快地对某人做出回应。

Chandrasekar的理念是“我们希望为不同种类的技术人员提供多种形式和项目类型。”

该公司还考虑添加用户的教学视频内容。他观察到:“有很多很棒的内容。”“想象一下,如果有人在测试DeepSeek,我们能够实时播放并捕捉它,而其他人可以从那种经验中学习。我们真的希望从成为一个知识库进入更多的社区网站。” 

如果这听起来像Reddit,Chandrasekar说他会得到很多。他指出,不同之处在于,“我们显然是一个非常专业的听众;我们并不是想成为所有人的万物。”他欣赏较大的社交网站。“我非常了解他们,而且他们很棒。他们对我们来说是一个非常亲密的表弟,或者也许是一个更大的兄弟。”

他观察到,Reddit与OpenAI的许可协议为知识解决方案业务铺平了道路。

扩大成功财产的危险总是存在危险,即人们的努力太薄了。堆栈溢出如何下注?

他说:“我们想挑选与用户产生最大共鸣的人。”“我经常与社区交谈,基本上与他们互动,以了解要加倍的加倍。我们实际上正在进行并进行哪些实际上有所作为。”

还:聊天机器人正在扭曲新闻 - 即使对于付费用户也是如此

内部与AI的关系也发生了变化。早些时候,当Chatgpt公开时,一些Stack Overflow的用户正在从机器人中获取现成的答案。该网站通过禁止剪切的答复来做出回应。 

他说:“但是,我们说,让我们与社区交谈,看看他们想如何做事。”“很明显的一件事是,人们仍然发现,将人类与人类提出问题相当粗糙。”

传统上,网站上的人类节制可能导致主持人责骂重复性或新手问题。“如果您问一个有关技术主题的问题,如果有人回答,有人会告诉您,这是一个错误的问题。询问之前先搜索。”

有“使用AI的巨大机会”。 

该网站最近以“双子座驱动”的答案播放。现在,“ Gemini给您一个提示,都被问到并回答了,然后将您带到相关的清单中,“全部在您和AI的私人窗口中”,因此您的新手询问中没有耻辱。” 

Stack Overflow公共网站的更改是最新的倡议,但是许可协议和团队的增加似乎已经在为业务提供了帮助。” 

展望

Chandrasekar说:“作为一家公司,我们正在成长。”同时拒绝披露财务状况。Stack Overflow由荷兰的欧洲投资巨头Prosus NV拥有,四年前以18亿美元的价格收购。一个 

Prosus已公开列出,因此该公司在宣布其完整的会计年度报告时可能会披露有关堆栈溢出的实际财务信息,该报告通常在每年6月底之前进行。

知识解决方案的一部分已成为Stack Overflow增长最快的业务,其次是团队销售和广告业务,这是一项“非常稳定”的业务,因为不断向他们花费时间的程序员做广告。Chandrasekar说,这三个是收入的三分之一。

也许这是社区处理它的方式。当该公司首次与Google和OpenAI有关数据许可方面的联系时,这是有反击的 - 毫不奇怪,因为社区从某种意义上考虑了6000万个质疑其社区财产,即使这在法律上是Stack Overflow Corporation的财产。

有很多用户说他们被禁止进入网站如果他们对许可交易引起轰动。

Chandrasekar说,在这一点上,堆栈溢出的用户已经意识到,公司并不是一个非营利的,它需要赚钱以实现其目的。” 

还:如果您更改帖子以抗议Openai的交易,堆栈溢出可能会暂停您的帐户

他回忆说:“我两周前做了一个AMA。”“我说,看,我们不像其他任何网站一样,但是我们不接受捐款。您有一个支持该网站的业务,而开展业务的一种方法是利用您拥有的东西来增加生态系统中的价值。”

他说,结果是:“他们意识到这对Stack来说是一件好事,对他们来说,因为不这样做,我们实际上并没有捕获我们需要能够投资于社区的收入,以建立所需的主持人工具。因此,社区现在慢慢地理解它,慢慢地理解它。”

想要更多有关AI的故事吗?报名,我们的每周新闻通讯。

关于《在AI时代,堆栈溢出如何增加人类答案的价值》的评论


暂无评论

发表评论

摘要

从提供的信息来看,很明显,堆栈溢出正在多元化其业务模型,而不仅仅是开发人员的问答平台。这是他们如何下注的一些关键点:1。**知识解决方案:**这正在成为堆栈溢出的增长最快的业务领域。他们正在将数据许可给Google和OpenAI等公司,这些公司使用了数百万个问题和答案的信息来改善其AI产品。2。**团队提供:**他们业务的另一个快速增长的部分涉及销售团队产品。这些可能是针对需要专用支持或专业工具的组织量身定制的。3。**广告收入:**这仍然是Stack Overflow收入的重要部分,因为公司对开发人员的大部分时间都有广告的需求。4。**社区参与和用户反馈:**了解用户对数据许可协议提出的担忧,Stack Overflow一直通过诸如AMAS之类的活动(问我任何会议)积极与社区互动。这表明了透明度和直接解决用户关注的努力。5。**双子座驱动的答案:**他们还通过集成了诸如Gemini之类的AI驱动工具(例如Gemini)来帮助用户更有效地找到答案,从而减少了他们寻求诸如ChatGpt之类的外部资源的需求,从而增强了平台的功能。6。**多样化的内容格式:**朝着结合教学视频并创建类似于Reddit的社区中的环境有了一个措施,但专门针对技术和编程。###战略优先事项: - **以用户为中心的方法:**与开发人员社区紧密合作以了解他们的需求并解决任何问题。 - **利用AI:**使用内部AI工具(例如Gemini)以及通过数据许可协议进行外部,以增强用户体验并产生收入。 - **平衡货币化策略:**通过合作伙伴关系在维持社区完整性的同时,在数据之间找到平衡。###未来前景:借助NV的所有权,Stack Overflow可以使用大量的财务支持。该公司发展知识解决方案业务和团队产品的能力表明,这些领域的持续扩展可能会继续进行。但是,他们必须继续解决用户的疑虑,以在核心社区中保持信任,同时探索新​​的收入来源。从本质上讲,Stack Overflow正在通过战略合作伙伴关系来利用其庞大的数据资源,同时通过AI Technologies不断提高平台的功能,同时又忠于其作为开发人员的信任社区的根源。