英语轻松读发新版了,欢迎下载、更新

创建AI应用程序的竞赛是在中国创造对培训数据的需求

2025-06-29 21:20:24 英文原文

作者:Emily Feng

创建更强大的人工智能应用程序的竞赛也在中国为高质量的培训数据创造了巨大的需求。

Scott Detrow,主持人:

正如NPR的Emily Feng和Aowen CAO报告所述,创建更强大的人工智能应用程序的竞赛还为高质量的培训数据和竞争提出了巨大的需求,其中很多需求在中国。

(鼠标单击的声音)

艾米丽·冯(Emily Feng),旁白:在中国东北部的这座新品牌新的办公大楼中,一排人坐在他们的计算机屏幕上静静地坐着。这是为生成的原始数据提供大量供电的燃料,而这个数据处理中心是这个人的创意。

亨利·陈(Henry Chen):我叫亨利·陈(Henry Chen)。

冯:他是Sapien AI的创始人。它雇用世界各地的人们收集数据并进行标记和组织,因此可以用来培训各种人工智能应用程序。中国是一个大市场。

陈:尤其是在DeepSeek出来之后。

Feng:DeepSeek,中国聊天机器人与美国训练有素的聊天机器人表演,但以一小部分成本进行了培训 - 对数据的需求就是为什么Chen的公司现在在中国有60名员工在中国标记中国街道的地图。今天,这些数据被用来培训自主驾驶计划。

AOWEN CAO,BYLINE:看起来很抽象。

冯:那是NPR制作人Aowen Cao。

CAO:我看到有人在计算机前工作,但是在计算机屏幕上,他们是带有正方形的黑色背景。

冯:正方形和绿色点 - 奥文笑着,电视节目“遣散”,看起来几乎看起来像是看起来好像。罗吉尔·克莱姆(Rogier Creemers)说,数据看起来可能是抽象的,但这是一种有价值的商品。他是荷兰莱顿大学的教授,研究中国的数字技术政策。

罗吉尔·克莱姆(Rogier Creemers):他们认为数据是一种经济投入,从某种意义上说,从某种意义上说,它对原材料类似。

Feng:如今,聊天机器人,例如Chatgpt,实际上需要数万亿个数据点才能达到速度,并且拥有数据越来越多地成为公司之间以及美国和中国等国家之间的竞争。每个人都希望在AI中比另一个优势,这意味着ho积数据。数据是一个令人难以置信的观点,以至于自去年以来,中国的网络空间监管机构必须批准任何大量的数据出口国外,这在某种程度上是为什么加拿大公司Sapien AI首先在中国开始的。

陈:对于这里培训的AI模型,数据需要在该国处理,并且不能离开该国。

冯:创建和保护数据的竞赛也是因为AI公司想要的数据变得越来越复杂。阿姆斯特丹注册数据处理公司Toloka的创始人Olga Megorskaya现在专门为高度技术科学和工程领域创建数据集。她使用一个类比,将早期AI模型与人类学分进行了比较。

Olga Megorskaya:这个人大约2岁。他或她被带有非常明亮的图片的儿童书籍教书。

冯:更高级的AI模型就像大学生。

Megorskaya:当她上大学时,她需要阅读数十本教科书。

冯:对于AI模型,这意味着要吞噬越来越高级的数据集。数据行业至关重要,以至于中国的地方政府曾经依靠钢铁制造和煤矿开采等垂死行业,正在积极招募AI数据处理公司。这再次是莱顿大学的克莱姆。

克莱姆(Creemers):中国希望通过发展未来的行业赚取大量资金。

冯:萨皮恩·AI(Sapien AI)选择找到其办事处之一的锈带市雪阳(Shenyang)是中国七个城市之一,他说它希望成为AI数据中心。该市提供贷款和灵活且负担得起的办公空间的低利率。这再次在Sapien AI。他们从此帮助中受益。

陈:所以他们也给了我们很多帮助,所以我们只是找到一个非常好的环境来在这里建立办公室。

冯:由于数据处理雇用了许多年轻人 - 中国的经济从未完全从全球冠状病毒大流行中恢复过来,而青年失业者已经足够涉及政策制定者,以至于他们短暂停止发布该统计数据。

(鼠标单击的声音)

冯:萨皮恩AI工作的年轻人之一是黄鲁(Huang Rui),现年21岁。她是数据质量专家。

黄鲁(Huang Rui):(说非英语语言)。

冯:她说,数据处理的工作适用于具有强迫症倾向的人,因为它需要高度关注细节。她的老板陈说,数据处理并不是最令人兴奋的工作。

陈:只想想象自己坐在桌子上,尝试每周在汽车周围绘制界限40小时。

冯:但是有时创新需要某人 - 实际上,很多人 - 做无聊的工作。NPR新闻Emily Feng。

版权©©2025 NPR。版权所有。访问我们的网站使用条款权限页面www.npr.org有关更多信息。

NPR转录本的准确性和可用性可能有所不同。成绩单文本可以修改以纠正错误或匹配到音频的更新。NPR.org上的音频可以在其原始广播或出版物后进行编辑。NPR编程的权威记录是音频记录。

关于《创建AI应用程序的竞赛是在中国创造对培训数据的需求》的评论


暂无评论

发表评论

摘要

在中国开发高级AI应用程序的竞赛导致对高质量培训数据的巨大需求,创造了访问此类数据的竞争。像Sapien AI这样的公司正在雇用成千上万的工人标记和组织原始数据,该数据用于培训各种AI系统,包括自动驾驶计划。该数据处理行业至关重要,因为它雇用了以前依靠行业下降的地区的年轻人,帮助地方政府振兴了其经济。