与
BCGShutterstock 数据科学和人工智能高级总监 Alessandra Sala 合作,她在负责任的人工智能领域拥有令人印象深刻的背景。作为 AI 领域女性的全球主席和联合国教科文组织 Women4Ethical AI 平台的联合主席,Alessandra 加入了本期的“我、我自己和 AI 播客”,讲述了 Shutterstock 这家广为人知的图库公司如何成为首选创意资产和 AI 训练数据的目的地。
Alessandra 概述了 Shutterstock 的内容获取和版税模型,该模型奖励那些资产用于训练第三方 AI 模型的贡献者,并为其他股票媒体公司设定了标准。她认为,这些道德方法不仅仅是一种道德选择,它们还提供了战略优势,因为这些资产对于塑造人工智能生成内容的未来是不可或缺的。了解 Alessandras 团队如何引领道德人工智能领域并重新定义创意格局。
在 Apple 播客或 Spotify 上订阅《我、我自己和人工智能》。
Sam Ransbotham:请继续关注本集,我和 Shervin 会讨论今天嘉宾的要点。
库存照片、视频和多媒体对许多人来说都是很好的资源。它们也是人工智能有用的训练数据。今天,我们与一家致力于确保他们公平公正地开发创意资产库的公司进行了交谈。
Alessandra Sala:我是来自 Shutterstock 的 Alessandra Sala,您正在聆听我、我自己和 AI 的声音。
Alessandra Sala:我是来自 Shutterstock 的 Alessandra Sala。>
Sam Ransbotham:欢迎来到《我、我自己和人工智能》,这是一个关于商业人工智能的播客。每集我们都会向您介绍人工智能创新人士。我是 Sam Ransbotham,波士顿学院分析学教授。我也是《麻省理工学院斯隆管理评论》的人工智能和商业战略客座编辑。
Shervin Khodabandeh:我是 Shervin Khodabandeh,BCG 的高级合伙人,也是我们人工智能业务的领导者之一。自 2017 年以来,MIT SMR 和 BCG 一直在人工智能方面进行研究和出版,采访了数百名从业者,并对数千家公司进行了调查,了解如何构建、部署和扩展人工智能能力,并真正改变组织的运营方式。
大家好。今天,Sam 和我很高兴邀请 Shutterstock 人工智能和数据科学高级总监 Alessandra Sala 加入我们的行列。亚历山德拉,欢迎来到节目。
亚历山德拉·萨拉:谢谢你,谢尔文。我很荣幸能与您和 Sam 在一起。
Shervin Khodabandeh:我认为我们的许多听众都了解 Shutterstock,但对于那些可能不了解的人,请快速向我们解释一下 Shutterstock 是什么。
Shervin Khodabandeh:我认为我们的许多听众都知道 Shutterstock。p>
Alessandra Sala:Shutterstock 不仅仅是一家图库摄影公司。它已经进化和改变了很多;Shutterstock 已成为从巨头到初创公司的首选平台,利用我们包含 8.25 亿个创意作品的库来训练 AI 模型。我正在谈论图像,我正在谈论视频,3D 模型,甚至音乐。
对我来说最有趣的方面是这个创意库,我们在人工智能的背景下可能会进一步讨论,这些内容是通过收集的这是一个超过 20 年的非常结构化的流程,每一件作品都经过审查,质量标准非常高,但它来自全球 150 个国家/地区的 300 万贡献者。
我负责设计,测量,真正构建人工智能应用程序,为我们的客户提供价值。我们的人工智能业务相当广泛。人工智能产品几乎涉及您今天在 Shutterstock.com 上可以找到的每一种体验。当您搜索时,我们不仅在构建产品时使用道德方法;我们还通过员工采用非常道德的方法来尝试提高技能。因此,我什至参与了讲座和教程,向我们的员工解释人工智能:我们如何使用它,我们在哪里开发它,以及他们如何接触这个领域。
Shervin Khodabandeh:除了 Shutterstock 之外,您还在许多组织中担任领导职务。如果可以的话,请快速描述一下您在参与的多个领域中的领导角色。
Alessandra Sala:我是 AI 女性组织的全球总裁,该组织是一个遍布全球 150 多个国家的非营利组织,我也是联合国教科文组织 Women4Ethical AI 平台的联合主席。最近,我主持了国际电联、国际标准化组织和国际电工委员会等多个不同标准组织之间的标准化合作,这些组织正在研究人工智能和多媒体,试图创建一套集体标准来打击深度造假,加强版权侵权。,水印解决方案,使人工智能安全。
Shervin Khodabandeh:几年前,作为一名业余摄影师,我接触过 Shutterstock,无论是为了贡献图像还是在自己的作品中使用一些图像。所以我想如果你回到十年左右,也许你会发现这是一个获得图像许可的地方。但我认为你的意思是,现在你正在使用这 8 亿多张图像作为训练 AI 模型的宝贵资源。请告诉我们更多相关信息以及为什么这如此重要。
Alessandra Sala:我们想要强调一些事情。所以第一个问题是,我们如何开发这些具有惊人品质的创意资产?这是因为多年来,摄影师和艺术家向 Shutterstock 提供了内容,我们已经审查了这些内容的质量和 IP [知识产权] 侵权情况。因此,今天,有了我们可以使用的大量创意资产,我们拥有了一组新的值得信赖且符合道德来源的数据。
当我说道德来源时,它在人工智能的背景下非常重要。我们看到很多公司从互联网上获取内容。从技术上讲,这称为抓取,这实际上意味着获取所有内容并构建那些巨大的人工智能模型。但不幸的是,我们在这个不受控制的数据集中存在抄袭、暴力内容和偏见等重要问题。
我想给你一个统计数据:如果你只花了一秒钟的时间如果您在一张图片上花费了 44 年的时间才能看到 8 亿资产。因此,当这些模型在数十亿数据集上进行训练时,没有人见过每一个例子。因此,如果您知道数据集是多年来收集的,[使用]质量标准进行审查,针对暴力、裸体以及所有我们知道我们不希望在模型中出现的内容进行审核,那么 Shutterstock 就会将其放置在Sam Ransbotham:当我第一次听说生成式 AI 时,我天真地认为我的假设是嘿,我们甚至不需要不再是 Shutterstock,因为我们可以让这些模型神奇地生成东西。但显然,这很天真,因为这些模型是根据过去的许多图像构建的。但如果我想到 Shutterstock,遵守道德并努力补偿创建图像的人确实是您商业模式的重要组成部分,这对我很有吸引力。但我想知道所有其他公司可能不会像 Shutterstock 那样有道德。当您尝试以道德方式行事并为创作者和艺术家做正确的事情,但其他人却不然时,Shutterstock 的世界会怎样?您在竞争中是否处于劣势?结果如何?
Alessandra Sala:这是一个很好的问题,Sam,我想说,由于几个原因,它现在变成了一个很大的优势。对于那些可能不知道的人,让我简单谈谈贡献者基金。我们将这些数据出售给大型人工智能公司或初创公司,以构建他们自己的模型,并与贡献者分享收入,但我们做得更多。
每次我们使用生成器在 Shutterstock.com 上生成图像时解决方案,我们出售该图像,我们与贡献者分享版税。因此,它是一个永久的模型,为它们提供即使每笔交易都非常小,随着时间的推移,如果这些解决方案扩展并成为每天数十亿次交互,那么收入将是重要的,并且将是可观的。
并且正如您所说,您这样做只是因为道德意味着让贡献者了解情况并为他们提供有意义的工作路径,还是还有其他原因?我很高兴与大家分享,最近的一些出版物表明,基于合成数据构建的模型开始很快退化。因此,这不仅是为了保持道德并让贡献者了解情况,贡献者实际上是我们业务向前发展所必需的。
让我们举一个能引起每个人共鸣的例子:在新冠疫情爆发之前;新冠疫情之后。在新冠疫情爆发之前,我们没有口罩[或]个人防护装备的图片。如果我们没有贡献者并且仅依赖人工智能生成的技术,也许就不可能生成我们现在拥有的所有可能的新冠病毒概念、口罩和个人防护装备的大量图像。所以,我想说的是,我们的设计是道德的,但我们也证明,通过道德,可以获得更大的回报。
Shervin Khodabandeh:是的,这不仅仅是道德,这当然非常重要,但也很有效。因为,正如你所说,随着时间的推移,这些模型的质量将变得非常非常重要,并且我们实际上在人工智能生成的一些图像中看到了这一点,其中一切看起来都很好,但也许手看起来都很奇怪,或者某些解剖部位,是因为太多而产生的。所以我认为你提出了一个有趣的观点。
我想了解你的反应的另一件事是,对于许多公司来说,生成式人工智能的采用受到了许多因素的阻碍,其中许多是技术因素。但法律、道德和负责任的人工智能考虑因素确实是许多公司的一个主要担忧,你提到的所有问题都是:侵犯版权、不安全的内容等。同样,许多公司正在使用生成式人工智能来创建内容用于各种目的的图像、文本、视频一直在非常仔细地探索生成式人工智能。当涉及到从数据生成内容时,您是否已经很大程度上降低了这种风险?
Alessandra Sala:所以我想从时间的角度来谈谈我们的未来。.
我们的道德方法并不是在生成式人工智能蓬勃发展时开始的。有一项投资[可以追溯到]几年前。因此,在 2021 年,我是联合国教科文组织唯一支持联合国教科文组织发布的人工智能伦理建议的行业代表,该建议得到了世界 194 个国家的批准。[这是]最大的建议文件,得到了众多国家的支持。
然后,我们将这些高级原则转化为实际方面。去年 11 月,我们推出了我们的信任框架:从培训[角度]来看,我们的五个支柱正在解决如何利用道德来源的培训数据?我们已经讨论过的版税:我们如何补偿我们的艺术家并为他们提供乐器,甚至是那些不属于我们网络但尚未通过不同镜头成为[网络]一部分的艺术家?[提升]为世界各地的多元化摄影师带来机会,以提供这些大量数据有时所缺乏的多样性。然后保障[和透明度]:回到你的问题,我们如何使其商业安全?
因此,商业安全意味着我们的世界和我们的化身中的一些事情。因此,首先,我们公司投入了大量资金来创建安全机制,控制生成暴力或不安全内容的企图,我们会阻止它。我们为客户提供许可保护。当他们需要我们的全面赔偿保护时,我们会审查该内容。因此,我们不仅生产和销售它,而且还生产它。如果它需要安全和控制机制,我们的审核员可以验证该内容是安全的,不侵犯任何地标、版权、商标。并且可以附上 Shutterstock 向其客户提供的质量证书。这是一项战略投资,也是将高级道德原则付诸实践的非常实际的转化。
Shervin Khodabandeh:我喜欢这一点。我想说,在很多方面,你们正在开创一种以安全且无商业风险或风险管理的方式利用生成式人工智能创建内容的方法。我很好奇你对它在其他领域的应用的想法,比如音乐、文本或其他形式。您认为其他人可以从这种方法中学习一些东西吗?
Alessandra Sala:所以我喜欢您的风险管理声明,因为它正是如此。我们今天使用的生成式人工智能与我们两年前开始使用的不同。一年用得好不一样。用户正在不断发展,正在学习如何与这项技术进行交互,如何使用这项技术在我们的生态系统中进行创建。因此,他们将教我们探索优势的新方法和克服弱点的新方法。
我们是业内第一个推出道德来源数据和信任框架的公司,该框架支撑我们的道德安全产品,它将这个版税框架带到了前端和中心,以支付贡献者。然后,所有其他竞争对手也纷纷效仿。业界认识到这是正确的前进道路。
另一方面,我确信人们知道内容真实性倡议,这是一个联盟,是标准背后的开源实施小组C2PA 组织,即内容来源和真实性联盟,由我们的竞争对手领导,并得到我们竞争对手的大力参与。
我们加入他们是因为我们了解展示内容的价值与人工智能生成的内容相比,它是真实的创作,并通过我们在这个行业中贡献的标准规则和协议来认证该内容。因此,这是一个非常开放的行业,我们为探索新的商业模式等提供了新的机会,并且我们从竞争对手那里获得了可以为我们的业务带来创新的机会。
Sam Ransbotham:所以让我们回去;我喜欢皇室[模特]。我想更多地了解它是如何运作的。我认为人们会对此感兴趣。如果我想想音乐,我们几年前就有了采样[趋势开始]。你知道,如果你采样一定数量,你就必须支付一些特许权使用费,并且有一些协议可以解决。但当你谈论 Shutterstock 时,这些都是非常非常微小的样本。您能解释一下有关版税的一些细节吗?
Shervin Khodabandeh:这也是我的问题。
Sam Ransbotham:这似乎很复杂。
Shervin Khodabandeh:你知道,Sam 和我以及另外 300 万贡献者正在贡献图像,如果生成的图像可能占用我内容的 3% 和 Sams 的 2%,那么归因在这里如何发挥作用?
Sam Ransbotham:看起来真的很难。
Alessandra Sala:是的,归因非常困难。一开始,我们甚至不知道。我们把钱放在一边,但我们甚至不知道如何将其分配给我们的贡献者,因为这是一个复杂的问题。
所以在行业中,有三种方法。Shutterstock 的方法是,我们为每个人做出贡献,具体取决于您向我们提供了多少资产。例如,我只提供了一项资产,而山姆则向我们提供了他一生的收藏。萨姆应该比我多一点,对吧?因为他通过他在职业生涯中创造的一切来教授这个模型。所以它是基于体积的。
业界有两种[其他方法],一是,我只在我生成一个杯子并且 Sam 给了我杯子的图像时进行补偿;山姆将获得捐款。亚历山德拉只给我人们游泳,所以没有贡献。从技术角度我根本不同意,因为模型和标准的A罩杯就是罩杯,游泳装备只有全面理解了世界上所有的概念才算是游泳装备。
第三模型基于流行度。所以,如果你给了我一个在市场上如此有价值的形象,我必须补偿你,山姆,比我的形象更多。从多样性的角度来看,我再次不同意这一点。我们知道,有时流行的东西并不能完全代表我们的世界、我们的文化、我们的偏好。这些利基领域具有很大的价值。事实上,在过去的几年里,我们看到了内容多样化的趋势,因此,只要关注流行的内容,富人就会变得更富。我们只向那些已经从我们的市场中获得大量资金的贡献者付费。
我们应该能够将财富分配给每个人,以及那些为我们提供优质内容的人。因此,我们与首席技术官进行了一些令人惊叹的领导力和战略思想领导力讨论,并且[我们]正在考虑新的归因模型,其中质量是首要和中心。就质量而言,我们指的是美观的内容、多样化的内容、独特的内容、安全的内容,所以质量的定义非常笼统。也许这些归因模型将会发展。我确信它们将来会发展,但这些都是今天使用的。
Sam Ransbotham:但是我内心的学术必须推迟一点,因为如果我考虑一下你的例子你的游泳图像可能很漂亮,而我的杯子图像可能非常丑陋,我可能会用大量低质量的杯子图像淹没你的市场。我明白为什么相似性是一个问题。我明白为什么人气是一个问题。而且,我也发现音量方面存在一些问题。这看起来真的很难。
Alessandra Sala:Sam,我喜欢这个,因为,是的,当你根据数量进行归因时,这正是问题所在。然而,我们所做的就是提供令人惊叹的服务,能够发现重复项或非常相似的内容。因此,我们尝试拥有更多独特的资产。如果我们有 2 亿个草莓,您的模型真正需要学习多少草莓图像?因此,我们进行了高质量的选择和重复筛选,以便我们实际用于培训的目录(即我们实际用于培训的集合)中的内容较少。
Shervin Khodabandeh:我想问您一些不相关的问题。-那么遥远的未来。也就是说,技术和艺术的界限正在受到挑战。我的意思是,我们确实看到了完全由人工智能生成的内容文本、图像、视频,它们在引发情感反应方面非常有效,就像一件宏伟的艺术品一样。您认为五年或十年后艺术和内容创作的未来会是什么样子,人工智能和人类,而且通常是人工智能,甚至会做出超出人类想象的令人惊叹的事情?
Alessandra Sala: 绝对地。我还使用我们的人工智能生成工具来创造我永远无法创造的东西。我认为,我们需要为那些无法创造、生成或产生美丽作品的人(比如我自己)做一个有趣的细分,在很大程度上通过这些工具获得了授权。我们通过这些工具赋予专业艺术家和摄影师的授权可能不太适合最终的创作或完整的创作,而是更适合他们的创作过程,如何获得灵感,如何尝试一些想法,而不需要拍摄我们想要的照片。知道需要大量的后勤、时间和金钱,但他们可以上演。他们可以准备他们想要实现的可能结果,然后只使用最能与他们的商业结果或机会产生共鸣的结果。因此,我认为不同的人将通过这项技术在不同层面上获得权力。
我认为我们还没有看到这项技术可以给我们带来什么,但我相信人类一直在利用我们拥有的每一种工具来进化[被]给予。让我们考虑一下飞机。我们人类的能力不允许我们以这种速度穿越太空,它可能永远不会发生。但我们已经利用航空作为一种工具来帮助我们的社会实现新的目标。我相信人工智能同样会让我们达到一个我们尚未达到的水平,并达到一个新的高度。
Sam Ransbotham:是的,这很有意义。如果我实际上回去的话,我整个夏天都在看蒂托布斯蒂略洞穴的一些洞穴壁画,它们非常迷人,我在想它们与我们的现代图像有多么不同。这些人必须真正努力才能将看起来像马的东西放到洞壁上。现在,你知道,只需说,嘿,给我看一匹马。然后你说,我不喜欢那匹马。我不喜欢那匹马。我不喜欢那匹马。我认为,当技术实现不同的技能时,这确实是一个令人着迷的转变。
谢尔文,我们在《神奇动力》[剧集]中与泰伊·谢里丹一起看到了这一点。他们试图让 CGI 可供大众使用,而不仅仅是大公司。看起来就像这里发生的事情一样。你确实降低了生产成本,这确实会让创造力变得更有价值,或者我希望如此。它将使人类的创造力变得更有价值。我认为这是一个非常乐观的看法。我希望这是真的。
Shervin Khodabandeh:我也希望如此。
Alessandra Sala:我也希望这是真的。
Sam Ransbotham:让我们过渡一下少量。我们有一段连珠炮般的问题。我们只想让您回答您想到的第一件事。目前人工智能最大的机会是什么?
Alessandra Sala:赋予人类进入下一个进化步骤的能力。
Sam Ransbotham:好的。人们对人工智能最大的误解是什么?
Alessandra Sala:它可以取代我们的专业知识。我认为这项技术需要控制很多东西才能赋予我们权力。
Sam Ransbotham:好的。您想要的第一份职业是什么?
Alessandra Sala:我想成为一名机械师和飞行员,而且我仍然热爱赛车。
Sam Ransbotham:很好。什么时候人工智能会太多?
Alessandra Sala:我认为人工智能永远不会太多。这就像在说多少空气才算过量?我可以呼吸了。我可以继续呼吸。
Shervin Khodabandeh:我喜欢这样。
Sam Ransbotham:大多数时候,人们总是会想到一些太多的事情。事实上,我喜欢乐观。有什么事情是您希望人工智能现在可以做但目前还不能做的吗?
Alessandra Sala:不,我希望我们围绕这项技术有更多的治理结构,就像在航空领域;这是一个安全第一的环境。我认为我们需要首先将创新帽子转向安全,因为它每天都会影响数百万人。
Sam Ransbotham:是的,影响影响到数百万人,错误传播得非常非常快,不是吗?
好吧。好的,感谢您抽出宝贵时间与我们交谈。我从来没有真正思考过这些模型将如何运作以及版税模型将如何运作。我并没有真正想过像漂移这样的事情有多重要。我认为,新冠病毒面具的例子是一个很好的例子,说明了世界如何导致模型很快不同步,但也说明了模型崩溃的想法,这些模型只是建立在自我生成的图像之上。也成为一个问题。在你提出这些困难之前,我确实没有考虑过很多这些困难。感谢您今天抽出时间与我们交谈。
Alessandra Sala:我很高兴。
Shervin Khodabandeh:这次谈话很有启发性,我发现有趣的是,有有句话说,也许10年前、15年前,数据就像原油,数据科学是使其变得有用的炼油厂,对吧?这很好,但在这种情况下,数据是什么?是客户数据、交易数据、行为数据、基本数据之类的东西,对吧?但它是数字,或多或少的数字。
Sam Ransbotham:表格数字。
Shervin Khodabandeh:表格数字,甚至是精细的文本和非结构化数据。它不是视频、图像、歌曲和音乐。这些人所做的基本上是说,不,Shutterstock 显然有自己的商业模式。我们有图像,我们有视频,我们有内容;我们将其授权给您,这样您就不必自己创建它。伟大的。这仍然是一个价值主张。但现在,我们拥有数以亿计的图像数据,这些数据可以成为生成式人工智能正在训练以创建内容的石油。
想象一下一家钻石公司或珠宝商的广告,其中一个男人正要向女人求婚。他们正在攀岩,就像是 8,000 英尺的垂直攀登。就在他们最后一次跳到那里之前,那个男人就像,哦,等等,他挂在安全带上,他伸出手,拿出戒指,然后说你愿意嫁给我吗?还有鸟瞰图,放大到他的脸和她的脸。一路跌入深渊。
Sam Ransbotham:到戒指坠落。
Shervin Khodabandeh:到一切,对吧?戒指掉落,她接住戒指,他接住她。想象一下制作它。这是不可能的。这将花费数亿美元,如果他们做到了,这将被称为“不可能的任务”。这是可以做到的。
Sam Ransbotham:是的。
Shervin Khodabandeh:现在还不太好,但很快,人们就可以坐在沙发上的笔记本电脑旁完成这项工作。只需输入上下文,无需任何制片人、演员、摄影师或外景侦察。太棒了。
Sam Ransbotham:这与 Tye Sheridan 的 Wonder Dynamics 理念有关,上一季我们与他交谈过,你知道,所有这些人都可以接触到它。而且,你知道,我认为 Shutterstock 有趣的另一部分是他们认识到这种油的好处,即该油不是合成油。我们有真油,也有合成油。上个月,《自然》杂志上发表了一篇很棒的论文,讲述了这些模型如何因为摄取合成数据而崩溃。
Shervin Khodabandeh:是的。
Sam Ransbotham:实际上,我认为罗斯·安德森 (Ross Anderson) 是该论文的作者之一。他刚刚去世。他是计算机安全界的一位伟大人物。但这篇论文是关于模型崩溃的。我认为 Shutterstock 处于一个有趣的位置,他们有真正的石油,而不是合成油,来完成你的石油类比。这在我们的世界中感觉是独一无二的,尤其是当它的体积和标签出现时。
Shervin Khodabandeh:没错。这是正确的。虽然,为了我自己的缘故,我希望合成油能像真正的油一样好,因为
Sam Ransbotham:因为那是你车里的东西?
Shervin Khodabandeh:我仍然喜欢内部内燃机。
感谢您今天的收听。下次,Sam 和我将与 Upwork 副总裁兼人工智能和机器学习主管 Andrew Rabinovitch 进行交谈。请加入我们。
Allison Ryder:感谢您聆听“我、我自己和人工智能”的演讲。和您一样,我们相信关于人工智能实施的对话不会从这个播客开始和结束。这就是为什么我们在 LinkedIn 上专门为像您这样的听众创建了一个群组。它被称为 AI for Leaders,如果您加入我们,您可以与节目创作者和主持人聊天,提出您自己的问题,分享您的见解,并获得来自 MIT SMR 和 BCG 的有关 AI 实施的宝贵资源。您可以通过访问 mitsmr.com/AIforLeaders 来访问它。我们将该链接放在节目注释中,我们希望在那里见到您。