作者:By Will Douglas Heavenarchive page
有时Lizzie Wilson与她的AI助手一起出现。
去年二月的一个周末,威尔逊将笔记本电脑插入了一台投影仪,将她的屏幕扔到了东伦敦的低天花板阁楼空间的墙壁上。一小撮人在昏暗的粉红色灯光的光芒中散发出来。威尔逊坐下来开始编程。
Techno点击并从场地扬声器中重击。观众看着,头点点头,威尔逊在预计的屏幕上逐行敲出了代码,调整了声音,循环节拍,弄乱时拉了一张脸。”
威尔逊是现场编码员。现场编码器不使用大多数电子音乐制作者(例如大多数电子音乐制作者)来创建音乐,而不是使用专用软件编写代码即时生成它。它是一个即兴表演艺术称为Algorave。
她说,当您去看表演时,这有点无聊,有人坐在他们的笔记本电脑上。”您可以欣赏音乐,但是有一个表现性的方面。通过实时编码,每个人都可以看到我打字的内容。当我的笔记本电脑崩溃时,人们真的很喜欢。他们开始欢呼
冒险是氛围的一部分。因此,威尔逊(Wilson)喜欢通过重新删除她所谓的现场编码代理,这是一种生成的AI模型,并提出了自己的节奏和循环以添加自己的演出。通常,模型表明威尔逊没有想到的声音组合。她说,您会得到这些令人惊讶的元素。您只需要去做。
阿德拉节
威尔逊(Wilson)是伦敦艺术大学(University of Arts Arts)创意计算研究所的研究人员,只是从事所谓的共同创造或超过人类创造力的众多工作之一。这个想法是,AI可用于激发或批评创意项目,帮助人们制作自己不会做的事情。她和她的同事建造了现场编码代理探索如何使用人工智能来支持威尔逊案中的人类艺术努力,即音乐即兴创作。
这是一个超越承诺现有的生成工具由Openai和Google DeepMind等公司推出。这些可以自动化一系列杰出的创意任务,并提供近乎固有的满足感但是要花多少钱?一些艺术家和研究人员担心,这种技术会使我们变成更多AI斜坡的消费者。
因此,他们正在寻找将人类创造力注入过程的方法。目的是开发AI工具来增强我们的创造力,而不是从我们促使我们更好地创作音乐,开发游戏,设计玩具等,并为人类和机器共同创造事物的未来奠定基础。
最终,生成的模型可以为艺术家和设计师提供一种全新的媒介,促使他们制作以前无法制作的东西,并赋予所有人创造性的超级大国。”
没有一种有创造力的方法,但我们都这样做。从模因到杰作,婴儿涂鸦再到工业设计,我们都会制作一切。通常,在成年人中,有一个错误的信念,即创造力是您成长的东西。但是,无论是烹饪,淋浴还是整理超级五型蒂克托克斯我们大多数人只是为了乐趣而做的事情。它不必是高级艺术或改变世界的想法(但可以)。创造力是基本的人类行为;应该庆祝和鼓励。
当Midjourney,OpenAi的Dall-E和流行的开源稳定扩散等产生的文本到图像模型到来时,他们激发了看起来很像创造力的爆炸。现在,单击按钮,数以百万计的人能够以任何样式创建几乎任何样式的图像。接下来是文本到视频模型。现在,像Udio这样的初创公司正在开发类似的音乐工具。创造成果从来没有如此众多。
但是对于许多研究人员和艺术家来说,围绕这些工具的炒作扭曲了创造力的真正含义。``如果我要求AI为我创造一些东西,那不是我的创造力。这是一次单拍的互动:您单击它,然后生成一些东西,然后是它。您不能说我喜欢这部分,但是也许在这里改变一些东西。您不能进行来回对话。
Rezwana指的是大多数生成模型的设置方式。您可以提供工具反馈,并要求他们再去。但是每个新结果都是从头开始生成的,这可能使您难以确切地钉住您想要的东西。正如电影制片人沃尔特·伍德曼(Walter Woodman)去年所说的那样,他的艺术集体害羞的孩子们做了带有Openai的文本对视频模型的短片第一次:Sora是您回来的老虎机。
更重要的是,其中一些生成工具的最新版本甚至都不使用您提交的提示,因为它可以制作图像或视频(至少在其默认设置上没有)。在将提示发送到模型之前,该软件通常会通过添加数十个隐藏的单词来编辑它,以使生成的图像更有可能看起来抛光。
伦敦国王学院的计算创造力研究员迈克·库克(Mike Cook)说,添加了额外的东西来榨出产量。``尝试要求Midjourney给您一些不好的图画,这可以做到这一点。这些工具不会给您想要的东西;他们给您设计师认为您想要的东西。
由迈克·库克(Mike Cook)提供
尼克·布莱恩·金·金斯(Nick Bryan-Kinns)说,如果您只需要快速图像并且不太关心细节,所有这些都很好,也可以在创意计算机研究所(Creative Computing Institute)说:“也许您想为您的家人制作圣诞贺卡,也想为您的社区蛋糕销售制作传单。这些工具很棒。
简而言之,现有的生成模型使创建变得易于创建,但它们并不容易发挥创造力。两者之间有很大的区别。对于库克来说,从长远来看,依靠这种工具实际上可能会损害人们的创造性发展。'他在去年发表的一篇论文中写道,尽管有许多这些创意的AI系统被提升为使创造力更容易获得,但他们可能会对用户产生不利影响,以限制其创新,构思和创造的能力,鉴于为了使每个人都在为所有人提供创造力的典范,他们可能会在任何情况下施加了更多的影响。
Devolver数字
由迈克·库克(Mike Cook)提供
他远非唯一担心这些技术的认知影响的研究人员。2月,Microsoft Research Cambridge的一个团队发布了一份报告结论是,生成的AI工具可以抑制与工作的批判性互动,并有可能导致对工具的长期过度依赖,并降低了独立问题解决的技能。研究人员发现,通过使用生成工具,人们的努力从任务执行到任务管理。
库克担心生成的工具不会让您失败,这是学习新技能的关键部分。库克说,我们有一个习惯说艺术家是有天赋的。但事实是,艺术家从事艺术工作,在数月和几年中发展技能。
他们说,如果您实际上与艺术家交谈,那么我会一遍又一遍地做到这一点,”他说。但是失败很糟糕。我们一直在寻找解决方面的方法。
生成模型让我们跳过做不好的挫败感。
库克说:``不幸的是,我们要删除您为自己发展创造力的一件事,这是失败的。”但是绝对没有人想听到这一点。
但是,这并不是所有的坏消息。艺术家和研究人员对生成工具可以增强创建者能力的方式嗡嗡作响,将他们指向令人惊讶的新方向,并将其转向死胡同。库克认为,人工智能的真正承诺将是帮助我们更好地在想做的事情上做得更好,而不是为我们做。他说,为此,我们需要创建与现在拥有的工具不同的新工具。他说,使用Midjourney对我没有任何帮助。”他说。我认为这是一个浪费的机会。
询问一系列研究创造力的研究人员列举创作过程的关键部分,许多人会说:反思。很难确切地定义,但是反思是一种特殊的集中,有意思考的类型。当一个新想法击中您时会发生什么。或者,当您的假设是错误的时,您需要重新考虑您的方法。这是一次性互动的对立面。
寻找AI可能会支持或鼓励反思的方式要求它将新想法投入到您已经掌握的想法中,这是共同创造研究的共同点。如果像dall-e这样的生成工具使创造无摩擦,那么这里的目的是将摩擦添加回。我们如何在没有材料后退的情况下进行真正的创造过程?”
以威尔逊的现场编码代理为例。她声称,这推动了她自己可能不会自己采取的方向即兴演奏。该模型经过广泛的现场编码社区共享的公共代码培训,建议代码段,这些代码与其他人的风格更接近她自己。这使得更有可能产生意外的东西。她说,不是因为您无法自己生产。”她说。但是,人脑的运作方式,您倾向于重复的想法。
去年,威尔逊参加了Bryan-Kinns及其同事们运行的研究他们调查了六位经验丰富的音乐家,因为他们使用各种生成模型来帮助他们创作音乐。研究人员想了解与技术的互动类型有用,哪些相互作用却没有。
参与者都说,即使模型提出令人惊讶的建议,即使是故障或错误的结果,他们也喜欢它。有时结果更好。有时,这个过程感到新鲜和令人兴奋。但是一些人在努力放弃控制。很难指示模型产生特定的结果或重复音乐家喜欢的结果。布莱恩·金斯(Bryan-Kinns)说,在某些方面,这与乐队一样。您需要具有这种风险和惊喜感,但是您不希望它完全随机。”
库克从不同的角度出乎意料:他哄骗了他为共同创建视频游戏而开发的AI工具的意外见解。他的工具之一,冰球该版本于2022年首次发行,为简单形状匹配的益智游戏(如Candy Crush或Bejeweleded)生成了设计。许多冰球的设计都是实验性的,笨拙的东西不希望它能提出您可能玩的任何东西。但这不是重点:库克使用Puckâ和一种名为Pixie的新工具来探索人们可能希望与共同创造工具进行哪种交互。
Pixie可以读取游戏的计算机代码,并调整某些线条以提出替代设计。不久前,库克正在制作一个名为Disc Room的流行游戏的副本,玩家必须在其中越过一个充满移动嗡嗡锯的房间。他要求Pixie帮助他提出一个设计水平的设计,而熟练和非熟练的球员也会发现同样难。Pixie设计了一个空间实际移动的房间。库克笑:这不是他的期望。他说,这基本上将房间变成了雷区。但是我认为这真的很有趣。我以前没有想到过。
由安妮·阿兹伯格(Anne Arzberger)提供由安妮·阿兹伯格(Anne Arzberger)提供
研究员安妮·阿尔兹伯格(Anne Arzberger)开发了实验性AI工具来提出性别中立的玩具设计。
荷兰代尔夫特理工大学的研究员安妮·阿兹伯格(Anne Arzberger)说,撤回假设或受到挑战是创作过程的一部分。
她说,如果我想到我最好的人合作的人,那么他们不是那些只是说“是的,对我提出的每个想法都很棒。”他们真的很关键,有反对的想法。
她想建立提供类似声音板的技术。作为一个名为的项目的一部分创建怪物,Arzberger开发了两个实验AI工具,可帮助设计师在设计中发现隐藏的偏见。她说,我对可以使用这项技术访问原本难以访问的信息感兴趣。”
对于该项目,她和她的同事们研究了设计的玩具人物是性别中立的。她和她的同事(包括Giaccardi)使用了可教机这是由Google研究人员于2017年构建的Web应用程序,可轻松训练您自己的机器学习模型以对不同的输入(例如图像)进行分类。他们用几十个图像训练了这个模型,阿尔兹伯格将其标记为男性,女性或性别中立。
然后,阿尔兹伯格(Arzberger)要求该模型确定新候选玩具设计的性别。她发现,即使她试图使其性别中立,也被认为有许多设计是女性化的。她觉得自己对自己隐藏的偏见的看法正在暴露出来。但是该工具通常是正确的:它挑战了她的假设,并帮助团队改进了设计。她说,可以使用相同的方法来评估各种设计特征。
然后,Arzberger使用了第二种型号,这是生成图像和视频启动跑道制造的工具的一种版本,以自己的性别中立玩具设计。首先,研究人员培训了该模型,以生成和分类男性和女性的玩具。然后,他们可以要求该工具找到一种恰好在所学的男性和女性设计之间的设计。
她说,生成模型可以对人类设计师可能会错过的设计反馈:我们真的可以学到一些东西。”
技术的历史充满了突破性,这些突破性改变了艺术的制作方式,从充满活力的新涂料颜色到摄影的食谱到合成器。在1960年代,斯坦福大学的研究员约翰·乔宁(John Chowning)花了多年的时间来研究一种可以操纵计算机生成声音频率的深奥算法。斯坦福大学将该技术许可到Yamaha,该技术将其建造为合成器包括DX7在内,1980年代背后的新声音如蒂娜·特纳(Tina Turner……
Bryan-Kinns对艺术家和设计师如何找到使用新技术的方法着迷。•如果您与艺术家交谈,那么他们中的大多数人实际上就不会谈论这些AI生成的模型,他们将它们作为一种材料,例如艺术材料,例如油漆或其他东西,”他说。这是一种思考AI在做什么的不同方式。他强调了某些人推动技术来做奇怪的事情的方式。他说,艺术家通常适当或滥用这些工具。
布莱恩·金斯(Bryan-Kinns)指出了他在创意计算学院的另一位同事特伦斯·布罗德(Terence Broad)的作品,这是一个最喜欢的例子。广泛采用像网络弯曲,其中涉及将新层插入神经网络中,以在生成的图像中产生故障的视觉效果,并生成图像未经数据培训的模型,几乎产生了类似Rothko的颜色的抽象拭子。
但是广泛是一个极端情况。Bryan-kinns这样总结了这一点:问题是,您在产生超高质量的非常高质量的非常高质量的工具之间得到了这一海湾,但是您几乎无法控制他们所做的事情,然后您得到了另一端,您可以完全控制自己的障碍,因为您需要做什么,因为您需要很高的障碍,因为您需要变得既舒适''的计算机。
他说,这是少数人。少数艺术家。
Arzberger承认与她的模特合作并不直接。运行它们花了几个小时,她不确定她使用的跑道工具甚至还可以使用。Bryan-Kinns,Arzberger,Cook和其他人希望将他们发现的各种创意互动进行构建,并将其构建为可以由铁杆编码器的人使用的工具。
由特伦斯广泛提供由特伦斯广泛提供
研究人员Terence Broad使用未经数据训练的模型创建动态图像,该模型几乎产生了Rothko样的抽象颜色领域。
但是,在惊喜和控制之间找到正确的平衡将很难。
Midjourney可能会惊讶,但它几乎没有杠杆来控制其产生的提示。一些人声称写作提示本身就是一种创造性的行为。库克说,但是没有人能像迅速挣扎的方式那样挣扎着画笔。”库克说。
面对这一斗争,库克有时会看着他的学生只是获得生成工具给他们的第一个结果。他说,我对这个想法非常感兴趣,我们正在努力接受您所要求的任何模型的东西,''他说。他正在设计一个实验,该实验会在类似提示中改变单词和短语,以测试人们在期望和获得的东西之间看到多少不匹配的人。”
但这是早期的。同时,开发生成模型的公司通常强调结果而不是过程。Rezwana说,这种令人印象深刻的算法进步,但是很多时间互动设计被忽略了。”
对于威尔逊来说,任何共同创造关系中的关键选择就是您所提供的。她说,您正在与计算机建立这种关系。”她说。有时会出错,这只是创作过程的一部分。
当AI给您柠檬制作艺术时。她说,在表演中完全具有对抗的东西,这是一种积极反对您并且您有争议的事情会很有趣吗?”她说。至少看着这很有趣。