为什么人类数据是人工智能的关键:来自 Scale AI - Andreessen Horowitz 的 Alex Wang

2024-09-24 16:15:52 英文原文

在与 a16z 普通合伙人 David George 的对话中,Scale AI 创始人兼首席执行官 Alexandr Wang 讨论了 AI 模型、计算和数据的三大支柱,以及如何创建丰富的数据成为新一代 AI 发展的核心。通过跨企业、汽车和公共部门的 Scales 工作,Alex 还构建了关键基础设施,使任何组织都可以使用其专有数据来构建定制的新一代人工智能应用程序。除了谈论前沿数据之外,Alex 还分享了他从 Scale 发展中学到的经验教训、他的领导方法,以及他认为成长阶段创始人/首席执行官在招聘方面容易犯的错误。

David:今天我们非常高兴有 Scale AI 的创始人兼首席执行官 Alex Wang 与我们在一起。亚历克斯,谢谢你来到这里。

亚历克斯:谢谢你邀请我。

大卫:我总是喜欢和你说话,而且我总是能学到很多东西。但也许首先,您为什么不告诉我们一些您在 Scale AI 正在构建的内容,然后我们就深入探讨。

Alex:At Scale 正在为 AI 构建数据铸造厂。退一步来说,人工智能可以归结为三大支柱。我们看到的所有进步都来自计算、数据和算法。所有这三个支柱的进步,计算都是由像 NVIDIA 这样的人提供支持的。算法的进步是由 OpenAI 等大型实验室主导的,而数据则由 Scale 推动。

我们的目标是与所有大型实验室合作,生成推动前沿水平进步所需的前沿数据。实验室,并使每个企业和政府能够利用自己的专有数据来推动前沿人工智能的发展。

David:所以在前沿数据这个话题上,实际上,比如,你实际上是如何做到这一点的?明白了吗?

亚历克斯:我认为这将是我们这个时代最伟大的人类项目之一,如果这有意义的话。而且,你知道,我们在世界上寻求创造的智能水平的唯一模型是人类,或者说是人类。因此,前沿数据的产生看起来很像人类专家和人类之间的某种联姻,围绕模型使用技术和算法技术来产生大量此类数据。

顺便说一句,我们今天在互联网上产生的所有数据看起来也是如此。从很多方面来说,互联网就是机器和人类之间的协作,以产生大量内容和数据。你知道,它看起来就像是打了类固醇的互联网。就像,如果互联网不仅仅是一个带有数据生成副产品的人类娱乐设备,如果它只是一个大规模的数据生成实验,会发生什么?

大卫:所以你有一个非常对行业现状的独特视角。您如何描述模型、语言模型现在的状态?我很想了解市场结构之类的问题,但现在行业的状况如何?

Alex:是的。我认为我们在语言模型开发的第二阶段结束时已经接近尾声了。我认为第一阶段是几乎类似的纯粹研究的早期。因此,第一阶段的标志是最初的 Transformer 论文、最初的 GPT 小规模实验。一直到 GPT-3 都是这种第一阶段的研究,非常非常专注于小规模的修补和算法的进步。

第二阶段,到目前为止是 GPT-3 的形式,实际上是初始缩放阶段。我们的 GPT-3 运行得很好。然后 OpenAI 真正将这些模型扩展到 GPT-4 及更高版本。然后你知道的许多公司,谷歌、Anthropic、Meta、xAI 也加入了这场竞赛,将这些模型扩展到令人难以置信的能力。

我认为在过去两年左右,或者说三年里,它执行几乎比什么都重要。它涉及很多工程。大规模培训究竟如何做好?你如何确保你的代码中没有奇怪的错误?如何建立更大的集群?我们做了很多执行工作才达到现在的水平,我们拥有许多非常先进的模型。

我认为我们正在进入一个研究将开始变得更加重要的阶段。许多实验室在选择探索哪些研究方向以及哪些研究方向最终在不同时期取得突破方面会有更大的分歧。因此,这是一个令人兴奋的交替阶段,介于原始执行与更具创新动力的周期之间。

大卫:他们已经到了一个我不会说有丰富计算能力的地步,但他们已经有足够的计算能力来找到它们所在的模型。这不一定是一个限制。他们已经用尽了所有前沿实验室的尽可能多的数据。接下来的事情将是在数据方面推进球。这公平吗?

亚历克斯:是的。如果你看一下支柱,计算一下,显然我们正在继续扩大训练集群的规模。所以我认为这个方向非常明确。在算法方面,我认为必须有很多创新。坦率地说,我认为这就是许多实验室真正努力进行纯粹研究的地方。然后是数据,您提到了这一点,我们已经用完了所有易于访问和轻松获得的数据,您知道,并且

大卫:通用爬行已全部完成,每个人都有相同的访问权限。

Alex:是的,完全正确。因此,很多人都在谈论数据墙:我们利用了所有公开可用的数据,有点撞到了这堵墙。下一阶段的标志之一实际上是数据生产。这些实验室将使用什么方法来实际生成使您达到更高水平的智能所需的数据?我们如何实现数据丰富?我认为这需要在许多领域进行高级工作和高级研究。

首先是真正提高数据的复杂性。因此,我们正在向前沿数据迈进。对于我们想要构建到模型中的许多功能来说,最大的障碍实际上是缺乏数据。比如,代理这两年很流行,基本上没有代理真正管用。事实证明,互联网上根本没有代理数据。没有真正有价值的代理数据池随处可见。因此,我们必须弄清楚如何生成真正高质量的数据。

David:举一个您必须生成什么的例子?

Alex:我们实际上有一些工作要做很快就会出现这个问题,这表明,现在,如果你看看所有的前沿模型,就会发现它们在组合工具方面很糟糕。如果他们必须使用一种工具,然后使用另一种工具 假设他们必须查找一些东西,然后编写一些 Python 脚本,然后绘制一些东西。如果他们连续使用多种工具,他们就会很糟糕。他们真的非常不擅长连续使用多种工具。这对人类来说实际上是非常自然的事情。

大卫:是的。但它没有在任何地方被捕获,这就是重点,对吧?

Alex:完全正确。

David:你实际上无法捕获某人从一个窗口到另一个窗口进入不同的应用程序,然后将其提供给模型以便其学习,对吗?

Alex:没错。所以这些推理链当人类解决复杂问题时,我们自然会使用一堆工具,好好思考事情,好好推理接下来需要发生什么,好好发现错误和失败,然后再回去重新考虑。很多这样的推理链、这些代理链、数据现在都不存在了。这是需要生成的示例。

但是退一步来说,数据需要发生什么?首先是增加数据复杂性,从而转向前沿数据。第二个是数据丰度,增加数据产量,所以

David:捕获更多人类在工作领域实际所做的事情?

Alex:是的。两者都捕获更多人类所做的事情,并投资于合成数据、混合数据等利用合成数据的东西,但让人类成为这个循环的一部分,这样你就可以生成更多高质量的数据。谈到芯片,我们谈论了很多芯片代工厂以及如何确保我们有足够的芯片生产手段,对于数据也是如此。我们需要拥有数据铸造厂和生成大量数据的能力来推动这些模型的训练。

最后一步是模型的测量并确保我们实际上拥有您知道的,我想有一段时间,业界已经说过,哦,是的,我们只需添加更多数据,我们就会看到模型有多好,我们添加更多数据,我们就会看到模型有多好。但我们必须非常科学地了解模型目前无法实现的功能,因此需要添加哪些类型的数据来提高模型性能。

David:有多少与独立实验室相比,大型科技公司的数据语料库有优势吗?

亚历克斯:嗯,他们在利用数据和现有数据语料库方面存在很多监管问题。这是在所有这些生成式人工智能工作之前,但 Meta 曾经做过一些研究,利用基本上所有公开的 Instagram 照片及其主题标签来训练非常好的图像识别算法。他们在欧洲遇到了很多监管问题。事实证明这是一个巨大的痛苦。所以我认为这是一件很难推理的事情,那就是从监管的角度来看,特别是在欧洲,这些公司将能够在多大程度上利用他们的数据优势。我认为这是一种待定。

许多大型实验室拥有显着优势的真正原因在于它们拥有非常有利可图的业务,可以为这些人工智能工作提供近乎无限的资本来源。这是我非常专心地关注的事情,或者我非常好奇它会如何发挥作用。

大卫:如果这个行业过度投资,就会出现整个问题。如果你听大型科技公司的财报电话会议,他们会说,看,我们的风险是投资不足,而不是投资过度。你对此有何看法?

亚历克斯:把自己置于桑达尔·皮查伊、马克·扎克伯格或萨蒂亚·纳德拉的立场上。就你的观点而言,如果他们真的掌握了人工智能这个东西,他们可能很容易再产生万亿美元的市值。如果他们真的领先于竞争对手并且以良好的方式生产,那么一万亿美元的市值是理所当然的。如果他们每年不额外投资 20 或 300 亿美元的资本支出(无论是什么),并且他们错过了这一点,那么就会存在一些真正的生存风险。他们的所有业务都可能被人工智能技术深深颠覆。

他们的风险回报非常明显。这就是大局。然后从更战术的层面来看,我认为他们所有人都将能够很容易地收回他们的资本支出投资,最坏的情况是,使他们的核心业务更加高效和有效。

大卫:是的,Facebook 广告的 GPU 利用率。

Alex:是的。如果 Facebook 或 Google 让他们的广告系统变得更好一点,他们就可以收回数十亿美元

David:是的,更好的表现。

Alex:是的,更好的表现。如果苹果能够完成升级周期,就可以轻松收回投资。我的意思是,我认为这些事情非常清楚。

David:看,他们投资如此多的资本对这个行业来说通常是件好事,因为他们也从事出租这种计算的业务,或者至少就 Google 和 Microsoft 而言是这样。

Alex:这些模型正在以自己的方式发展,Llama 3.1 是开源的。因此,甚至所有投资的实际成果也变得可供广泛获取。这些模型中开源产生的盈余有点疯狂。

David:太疯狂了。好的。这就是模型层市场结构的一个很好的延续。那么你认为实际发生了什么?是否有我们现在都确定的少数几个球员,并且他们都在竞争?你认为这是一项有利可图的生意吗?开源对业务质量有何影响?请提前几年告诉我们您的预测。

Alex:我们在过去看到,即使是一年半的时间,模型推理的定价,你知道,急剧下降,戏剧性地,戏剧性地。

David:一个数量级。

Alex:是的,两年内两个数量级。因此,事实证明,智力可能是一种商品,这令人震惊。我认为,纯模型层定价能力的巨大缺乏肯定表明,单独出租模型可能是也可能不是最好的长期业务。我认为它可能是一项相对平庸的长期业务。

David:嗯,我想这取决于突破性的事情,这是前面的一点,对吧,在某种程度上,有人实际上拥有持久突破或多个人实现持久突破,那么市场结构可能会有所不同。

Alex:所以有两件事。首先,如果 Meta 继续开源,那么您可以从模型层获得的价值就会受到很大的限制。其次,如果至少有少数实验室能够随着时间的推移具有类似的性能,那么这也会极大地改变定价方程。所以我们认为这不是100%,但纯模型租赁业务很可能不是最高质量的业务。哪里有更高质量的企业,哪里的企业就会处于领先地位。

David:是的,当然。

Alex:因此,我的意思是,NVIDIA 显然是一家令人难以置信的企业。但云也有非常好的业务,因为事实证明,实际建立大型 GPU 集群在逻辑上相当困难。云提供商在出租时实际上拥有相当不错的利润。

David:传统的数据中心业务在很大程度上是一场规模游戏。因此,相对于较小的参与者,他们受益匪浅。

Alex:是的,确实如此。所以我想到了镐和铲子。如果你处于模型层之下,那里有很棒的业务。如果您位于模型层之上,如果您正在构建应用程序,ChatGPT 是一项伟大的业务。初创领域的许多应用程序实际上运行得很好。我的意思是,显然,它们都没有 ChatGPT 那么大。但很多应用程序如果能够抓住早期产品市场的契合点,最终会成为相当不错的企业,甚至是伟大的企业。因为如果他们获得正确的整体用户体验,他们为客户产生的价值远远超过模型的推理成本。这里有一些很酷的东西,对吧?就像,我认为 Anthropics 在 Claude 中推出了 Artifacts

David:是的,那很酷。

Alex:这就像这个主题的第一个针掉落,你知道,所有的实验室将推动更深入的产品集成,以便能够推动更高质量的业务。我认为我们将在产品层和产品级别看到大量迭代。那种无聊的聊天机器人不会成为最终产品。这不是最终的交易。

David:这会是一个令人失望的结果。

Alex:是的,确实如此。产品创新周期很难预测,因为我的意思是,OpenAI 对 ChatGPT 的出色或受欢迎程度感到惊讶。坦率地说,我认为对于行业中的任何人来说,这并不是那么明显,哪些产品将受到冲击,哪些产品将提供下一步的增长。但是,你知道,你必须相信 OpenAI 或 Anthropic 可以为他们建立长期、独立和可持续的伟大应用程序业务。

David:然后,是什么推动了竞争优势?显然,您已经有了模型,在其之上有一个紧密集成的产品,然后是良好的老式模式。工作流程、集成,你知道,所有这些东西。

Alex:你可以清楚地看到他们的想法。我的意思是,OpenAI 和 Anthropic 都在两个月内(我不知道)聘请了首席产品官。

David:是的,他们正在解决这个问题。您拥有一家拥有一些非常有趣的客户的应用程序业务。您从企业那里了解到他们实际上是如何实施这一计划的?

Alex:我们看到的是,企业对此感到非常兴奋。很多企业都说,妈的,我们必须开始做点什么了。我们必须抢先一步。我们必须开始尝试人工智能。我认为这导致他们进入了这个快速的 POC 周期,他们会说,好吧。我们有哪些容易实现的想法?

David:去购买人工智能的东西。

Alex:让我们尝试所有这些。其中一些事情是好的。其中一些不好。但无论如何,这真是太疯狂了。投入生产的 POC 数量比我认为行业整体预期的要少得多。现在很多企业都在关注,你知道,他们以为可能已经发生的世界末日,实际上并没有发生。人工智能尚未完全改造和改变大多数主要行业。

David:它是一种边缘化的东西。它就像效率的提高和支持,你知道,然后是一些创造性的任务和类似的事情。

亚历克斯:是的,完全正确。

大卫:否则,它很轻。

Alex:我们经常思考的问题是,哪些人工智能改进或人工智能转型或人工智能工作实际上可以有效地推动合作公司的股价。

p>

David:哦,有趣。

Alex:这就是我们鼓励所有客户真正思考的问题,因为归根结底,潜力是存在的。几乎每个企业都有潜在的潜力来实施人工智能,从而显着提高其股价。

David:主要表现为节省成本、提高效率。

Alex:嗯,今天的形式是节省成本,但随后也有更好的客户体验。在许多需要与客户进行更多手动交互的行业中,如果您拥有更多标准化并能够使用更多自动化,那么您应该能够推动更好的客户交互。这些最终将获得相对于竞争对手的市场份额。这就是我们的客户所追求的目标,我也明白这一点。与我们合作的一些首席执行官都参与其中,他们明白这将是一个多年的投资周期。他们可能不会在下个季度看到收益,但如果他们真的渡过难关,他们将看到巨大的转变。

我认为围绕小型用例和更边缘用例的大量狂热很好。我认为这很令人兴奋。我认为他们应该这样做,但对我来说,这不是我们来这里要做的事情。

大卫:是的。它非常像应用层现在处于第一阶段,即:它即将到来。有一些自动化,但主要是聊天机器人。作为一名初创企业投资者,我希望随着时间的推移,将为初创企业打开一扇窗,产品创新将帮助它们赢得并击败现有企业。我的合作伙伴 Alex Rampell 有这样一句话,那就是,初创公司是否会在现任者发现创新之前就进行分销?我认为这是有机会的,但现在技术还为时过早。我不知道你是否同意这一点,但是

Alex:我认为这项技术还为时过早。同样,因为它主要节省成本。我认为,如果大部分好处都在节省成本方面,那么这还不足以扰乱已经克服了所有增长和分销成本的大型现有企业。

大卫:有多大价值?你认为数据在企业内部吗?正如您所说,摩根大通拥有 15 PB 的数据或其他数据。我不记得这个数字是多少,但这是否被高估了?其中有多少是真正有用的?因为今天,大部分数据并没有给他们带来一些有意义的竞争优势。您认为这实际上会发生变化吗?

Alex:我认为人工智能是您第一次看到潜在的变化,因为显然存在整个大数据浪潮。大数据归结为更好的分析,这对业务决策有帮助,但影响不大。

David:它不会极大地改变产品的工作方式。

Alex:是的, 确切地。而现在,您实际上可以想象产品工作方式发生的巨大转变。让我们以任何一家大银行为例。用户与摩根大通或摩根士丹利等大型银行之间的许多有价值的互动都是由人驱动的。而且,您知道,他们尽最大努力确保全面的高体验质量。显然,对于任何大型手动流程,您只能做这么多来确保这一点。

但是您之前的所有客户交互以及您的业务历史上的运作方式构成了唯一可用的数据训练模型以出色地完成这项特定任务。如果你考虑财富管理,互联网上几乎没有可供你训练模型的分布数据。

大卫:所以在墙后面,实际上有很多。它非常丰富。

Alex:是的,大量的数据。我认为很多数据可能与实际业务转型并不是非常相关,但有些数据非常有价值。但企业在实际利用他们拥有的任何数量的数据方面遇到了很多麻烦和挑战。

David:是的。

Alex:我的意思是,它的组织性很差。它无处不在。他们向咨询公司支付数千万美元、数亿美元来进行这些数据迁移。而且,你知道,即使在那之后

大卫:结果也没有改变。

亚历克斯:是的。结果没有变化。所以我认为历史上企业真正推动转型是非常困难的。在某些方面,这就是一场竞赛:他们是否能够比一些初创公司更快地弄清楚如何利用和利用他们的数据

大卫:创建一个截然不同的包含一小部分数据的产品。

Alex:是的,完全正确。

David:转变你的公司运营方式:你谈到的其中一件事是你在 2020 年和 2021 年的招聘高峰期犯了一个错误,即为了扩大规模,你必须雇佣大量员工。我们在所有投资组合公司中都看到了这一点。这是一场人才争夺战:哦,我们必须走得更高。我们必须走得更高。我们必须走得更高。那么,您通过这个过程学到了什么教训?然后,您后来如何改变了做事方式?

Alex:所以在过去的几年里,我们的员工人数基本上保持不变。整个过程的要点是,感觉非常合乎逻辑:更多的人等于更好的结果,更多的人等于完成更多的事情。但相当矛盾的是,我认为如果你有一个非常高绩效的团队和一个非常高绩效的组织,那么在不失去所有高绩效和所有获胜文化的情况下几乎不可能大幅发展它。

大卫:是的。减少沟通和协调开销实际上可以提高生产力。

Alex:确实如此。我认为它实际上是更深层次的东西,就像一个具有一定规模的非常高绩效的团队几乎就像这个团队中所有人之间相互作用的非常复杂的雕塑。如果你只是添加一堆人,即使这些人很棒,也会把整个事情搞砸。无论如何,当你增加人数时,你就会回归均值。你知道,如果你观察那些确实大幅扩大员工规模的公司,这对他们的财务业绩来说是相当核心的,他们就会承认这种回归。因此,例如,如果您考虑扩大大型销售团队的规模,您就承认将会出现均值回归。但你只需进行操作,使自己的成绩略高于平均水平即可。如果你能够做到这一点,那么整个方程式在财务上仍然有效。

大卫:是的,我想说销售与产品是不同的。

亚历克斯:是的,完全不同。但我们的观察是,初创公司之所以能够成功,是因为你拥有非常高绩效的团队,并且你希望尽可能长时间地保持这些高绩效团队的完整。

我认为常见的启动失败模式是:你有一些可行的东西,但公司里的每个人都很初级。所以事情正在扩大,但所有的轮子都在脱落。你的投资者告诉你,嘿,你应该聘请一些高管。你每次都会经历这些令人心碎的搜索。但是你经历了这个,如果你很擅长,它就成功了一半。

所以你经历了执行搜索。你引入了一位高管,然后给了这位高管很多绳索。你的主管说,嘿,我们需要雇佣一支庞大的团队来实现我们的目标。你会说,是啊。我的意思是,我很有经验。看来你真的很有经验啊。我们就按你说的做吧。你让这些大团队得以建立。现实情况是,我认为这几乎总是会导致破产。

这并不是说你不能从外部聘请高管,但我认为当你从外部聘用高管时,你需要做的是确保他们真正了解公司的运作方式。在提出任何重大的全面建议之前,他们会先了解公司的节奏和运营情况。他们首先了解为什么整个事情会起作用吗?为什么那些正在发挥作用的东西正在发挥作用?然后他们提出深思熟虑的建议。最初,他们采取一些小步骤,您信任并验证这些小步骤中的每一个。最终,也许他们可以提出更全面的建议,但他们应该有明确的记录,采取一些真正有益的小步骤。

大卫:这很有趣,而且非常切实:开始当你雇用一位大高管时,你的规模就很小了。这有点违反直觉,也不是那些高管想要走的路。

Alex:是的。我认为我注意到了高管的幻想。顺便说一句,我认为高管们都是伟大的人,他们令人难以置信。但高管幻想有一种倾向,特别是对于拥有年轻创始人之类的硅谷公司来说,那就是,哦,我要进来,我要解决这个混蛋。我不应该这么说。但是,我要进来,我要解决整个问题。我将使这成为一项专业的行动。

你最终要招募队友。你不是在招募魔杖。您正在招募一位团队成员,您相信他在很长一段时间内能够对业务做出反复的决策,从而具有出色的判断力。这就是我们犯错误的地方:您不会购买一些神奇的商品袋,将这种神奇的公式带入您的业务,从而突然使整个事情发挥作用。

您知道,反过来一方面,还有创始人的幻想。创始人的幻想,或者创始人/首席执行官的幻想是,哦,我要雇佣一群令人难以置信的高管。他们都会成为职业选手。然后,我要去

大卫:他们会做我不想做的事情。

亚历克斯:是的。他们会做所有我不想做的事情。我将能够坐下来,看着齿轮发生变化,看着机器工作。这也是极其不现实的,因为反面也是如此。你之所以成为一名优秀的创始人/首席执行官,是因为你在很长一段时间内一遍又一遍地做出非常好的决策。将自己从这些决策循环中拉出来有点疯狂。

大卫:这是我们经常看到的模式,这就是我要雇用高管。我要退一步。然后是哦,该死的认识,一些重大决策出错了,创始人记得这就是他们存在的意义。

亚历克斯:我认为如果你的行业非常稳定,那么它可能会起作用。

David:嗯,看看任何一家上市公司,当他们更换首席执行官时,股价都会波动 2% 左右。哦好的。好吧,实际上,这并不重要。就像,那是一个齿轮,但这与创始人经营的高增长初创公司有很大不同。

Alex:没错。我认为很多初创公司和很多公司都因为创新溢价而变得有价值。

David:百分之一百。

Alex:投资者认为创始人领导的公司是去创新超越市场。所以你的工作就是在创新上超越市场。所以你最好参与战略决策。

David:MEI 怎么样?您最近推出了这个概念。我想我的 X feed 中有一半是在赞扬你——你知道,可能超过一半。我的 X feed 的某些部分正在对你大喊大叫。谈谈概念。到目前为止,您对推出这一计划有何看法?

Alex:MEI,我们推出了这种关于优点、卓越和智慧的理念。基本想法是,在每个角色中,我们都会雇用最优秀的人才,无论他们的人口统计数据如何。我们不会对我们的劳动力进行任何基于配额的优化来满足某些人口目标。这并不意味着我们不关心多样性。我们实际上关心为我们的所有角色拥有多样化的管道和多样化的漏斗顶部。但归根结底,每项工作中最优秀、最有能力的人都将是我们雇用的人。这是引起轻微争议的事情之一。但如果我们在公司应该雇用谁的问题上退一步,我认为这是显而易见的。

公司应该雇用最有才华的人。显然有一个大问题:公司在其所做的事情中承担了多少社会责任?我的看法是我在一个竞争非常激烈的行业中经营。天平的作用是帮助推动人工智能。其技术非常重要。我们需要非常聪明的人才能做到这一点,我们需要最优秀的人才能做到这一点。Scale 的大多数人都会说这绝对是正确的,或者说这并没有偏离我们很多人对 Scale 所做的事情的看法。但将其编纂对我们来说确实很有价值,因为它给了每个人信心。即使这就是我们今天的运作方式,公司会随着时间的推移而改变,但不会改变这种质量。

大卫:嗯,这太棒了。我想以一个乐观的问题和预测来结束。您对AGI的看法或定义是什么?当我们到达时,您的预期时间表是什么?

Alex:是的,我喜欢这个定义。假设人们可以纯粹在计算机上做的80多个工作,因此以数字为中心的工作可以完成这些工作。它不是迫在眉睫的,也不立即在地平线上。因此,按四年以上的命令。但是,您可以看到闪烁的人,并且取决于我们之前谈论的算法创新周期,可能会变得更快。

David:非常令人兴奋。好吧,亚历克斯,感谢您在这里。一如既往地与您聊天。我学到了很多。我真的很感激。

alex:是的,谢谢你。

关于《为什么人类数据是人工智能的关键:来自 Scale AI - Andreessen Horowitz 的 Alex Wang》
暂无评论

摘要

在与 a16z 普通合伙人 David George 的对话中,Scale AI 创始人兼首席执行官 Alexandr Wang 讨论了人工智能模型、计算和数据的三大支柱,以及如何创建丰富的数据成为新一代人工智能发展的核心。大卫:所以关于前沿数据这个话题,实际上,就像,你是如何真正获得它的?亚历克斯:我认为这将是我们这个时代最伟大的人类项目之一,如果这有意义的话。就像,如果互联网不仅仅是一个具有数据生成副产品的人类娱乐设备,如果它只是一个大规模的数据生成实验,会发生什么?大卫:所以你对这个状态有一个非常独特的视角。行业。大卫:看,他们投资如此多的资本对这个行业来说通常是件好事,因为他们也从事出租这种计算的业务,或者至少在谷歌和微软的情况下是这样。在某些方面,这就是一场竞赛:他们是否能够比一些初创公司更快地弄清楚如何利用和利用他们的数据大卫:用一小部分数据创建一个截然不同的产品。