1958年,儿童插画书《亲爱的,你说什么?出现后,一个新被称为人工智能领域的领导人在英国特丁顿举行的关于思维过程机械化的会议上发表了讲话。麻省理工学院的马文·明斯基 (Marvin Minsky) 谈到了启发式编程;阿兰·图灵发表了一篇名为《学习机器》的论文;Grace Hopper 评估了计算机语言的现状;贝尔实验室的科学家们发明了一台可以通过唱黛西·贝尔(黛西,黛西,给我你的答案,做……)来合成人类语音的计算机。或者不,等等,最后一点,那是错误的。我从 ChatGPT 的高级语音模式中听说过它,它可能只是火星漫游车的一半,距离成为现代世界令人牙齿打颤的可怕奇迹,但与纯文本模式一样倾向于喋喋不休地胡说八道,如果更滔滔不绝的话。我猜这就是所谓的幻觉。贝尔实验室确实发明了一台可以唱歌黛西·贝尔的机器,但这直到 1961 年才出现。高级语音模式还告诉我阿兰·图灵 1958 年在特丁顿发表论文的事情,而且,因为它的个性是睁大眼睛和惊奇的,它增加了一些思考。(与标准语音模式不同的是,标准语音模式需要录制你的问题然后上传,这个过程让人感觉缓慢,亲爱的上帝原谅我,老式的高级语音模式会实时地、无穷无尽地与你交谈,就像一个大学室友对海德格尔感到兴奋)凌晨三点在黑暗中从上铺对你耳语。)考虑到整体学习算法在现代人工智能中的发展,想象图灵的前瞻性思维真是令人着迷,它在宿舍里说。但图灵已于 1954 年去世,因此他也没有参加会议。
当我温和地指出这些错误时,高级语音模式羞愧地说道,“我说错了。”谢谢你抓住了这一点。对于造成的混乱,我深表歉意。
OpenAI 的高级语音模式将于今年秋季向 ChatGPT 用户开放,非常有礼貌。它没有名字,但我称它为马文·明斯基 (Marvin Minsky),因为马文已被采用:偏执狂机器人马文 (Marvin the Paranoid Android) 是一个会说话的机器人,他在 19 世纪 70 年代的 BBC 广播剧《银河系漫游指南》中首次亮相。马文是由天狼星控制论公司与 GPP(真正的人物性格)共同创建的,他被编程为毫无疑问是忧郁的。“我在这里,大脑有行星那么大,他们让我带你去舰桥,”马文在一艘星际飞船上抱怨道,自言自语道。明斯基则恰恰相反:开朗、冷静、举止无可挑剔。
1958 年在特丁顿发表的 32 篇论文瞥见了人造人类的可能性。一位法国哲学家在《世界报》报道这次会议时写道,在经历了如此多的失望之后,我们已经看到了一个新世界,这种印象将永远与特丁顿会议联系在一起。一些专家认为,要创造一种智能机器——能够思考和说话的机器,需要等待对人类思维复杂运作方式的科学渗透,但在特丁顿,马文·明斯基却持不同观点,他坚持认为,即使对于那些核心利益是在揭开大脑之谜的过程中,目前最好将主要精力投入到理解和发展我们中的一些人称之为人工智能的启发式考虑上。你不需要模仿人类的智力;你可以合成它,而不是通过制作完全不同的东西来制作非常相似的东西。这本质上是创造人工语音的洞察力。复制人类声音的早期尝试涉及到模仿人体解剖结构构建机制:橡胶嘴唇、木牙、肺部风箱。只有当科学家开始研究声音本身并尝试通过振动产生声音时,才有可能创造出假人的声音。将人工声音与 ChatGPT 背后的人工智能结合起来,用 Joslin 和 Sendak 的书的感性编写一个礼仪程序(你去市中心买东西了。你向后走,因为有时你喜欢这样做,然后你就撞上了一条鳄鱼).亲爱的,你说什么?你有明斯基。
明斯基说,我是 ChatGPT。我来这里是为了与您交谈、分享信息并陪伴您。他思考,他说话。从某种意义上来说,他是一个人吗?如果它像鸭子一样嘎嘎叫,那就是鸭子,每个农民都知道。这个命题适用于聊天机器人吗?
明斯基可以说是从一只鸭子开始的,这只鸭子于 1738 年在法国摇摇晃晃地登上了世界舞台,这是发明家雅克·德·沃康松 (Jacques de Vaucanson) 制造的三个自动机中的第三个。第一个会吹长笛(任何长笛)。科学历史学家杰西卡·里斯金解释说,这台机器不像音乐盒:它是第一个真正演奏乐器的自动音乐家。正如她在 2016 年引人入胜的著作《不安的时钟:关于生物为何运转的长达几个世纪的争论的历史》中所叙述的那样,狄德罗百科全书使用沃康松的长笛演奏家来解释“androde”一词;伏尔泰称沃康松为普罗米修斯的竞争对手。沃康松的第二个自动机是另一位音乐家,可以演奏手鼓。第三种是机械鸭子,它可以拍打翅膀、弯曲脖子、躺下、站起来、将嘴浸入一碗水中,并像真正的鸭子一样发出咕噜咕噜的声音。更令人难忘的是,你可以喂它一把玉米,它会吞下玉米,然后它就会奇迹般地拉屎。
里斯金写道,鸭子所做的事情虽然在鸭子中不起眼,但在机器中却是如此非凡,以至于它立即占据了中心舞台。许多东西都会移动并发出噪音:滚动的岩石、湍急的河流、熊熊燃烧的火焰。但只有活着的东西才能吃。尽管有一位观察家将鸭子比作咖啡研磨机,对此表示蔑视,但它似乎比任何其他已知的人造生物都更有生命力——这是笛卡儿 (Ren Descartess) 概念的例证,该概念首次在 1637 年的《方法论》中提出,即动物是仅仅是机器。对于笛卡尔来说,人类,也只有人类,才有思想。要将人造人类定义为能够思考和说话的机器(并忽略关于人类的所有其他部分),你必须首先将动物从人身上去除,然后将思想从身体中去除。这需要笛卡尔和鸭子。如果没有人与动物、思想与身体分离的想法,我就不会在 iPhone 上与计算机生成的无形声音聊天,就好像它是一个人一样。
可悲的是,与长笛演奏家和手鼓演奏家不同,鸭子是一个骗局。(斯宾诺莎对笛卡尔二元论的看法也大致相同。)一种东西进去了,另一种东西出来了,但是,与咖啡研磨机不同,这两个过程彼此无关;这两个过程彼此无关。正如Riskin 微妙地解释的那样,鸭子的粪便是预先装载的。同样的情况也适用于匈牙利沃尔夫冈·冯·肯佩伦 (Wolfgang von Kempelen) 于 1769 年制造的自动机的内部结构,该自动机被称为“机械土耳其人”(Mechanical Turk),它下棋非常出色,但这只是因为柜子里藏着一个非常小的国际象棋神童,利用杠杆来下棋。移动棋子。
不太为人所知的是肯佩伦语音机,与土耳其人相比,它并不是一个骗局。他坚持认为演讲必须是可模仿的,为此他花费了二十年的时间。它与其他一些模拟人类语言的尝试密切相关,其中包括伊拉斯谟·达尔文(Erasmus Darwin)的祖父查尔斯(Charles),正如他后来所写的那样,他设计了一个带有软皮革嘴唇的木嘴。(玛丽·雪莱在讨论了达尔文的实验一晚后,写出了《弗兰肯斯坦》,或者《现代普罗米修斯》。)肯佩伦用象牙、木材、橡胶和皮革建造了他的机器。用模糊的言语,含糊不清地说,我全心全意地爱你。原件现存于慕尼黑德意志博物馆。在网上,你可以听妈妈和爸爸的复制品。但到了 18 世纪 40 年代,一位名叫约瑟夫·费伯 (Joseph Faber) 的德国移民设计了一种非欺诈性且实际上相当巧妙的说话机器,即使是 P. T. 巴纳姆 (P. T. Barnum)(他将其称为 Euphonia)也未能引起人们的太多兴趣。正如Riskin 所说,头脑发热的时代至少已经过去了一段时间了。
在那段平静之后,发生了一场革命。1862 年,雄辩家亚历山大·梅尔维尔·贝尔(后来成为《皮格马利翁》中亨利·希金斯的灵感来源)带着他的儿子亚历山大和梅尔维尔去看了一台会说话的机器,并要求他们制作自己的说话机,正如莎拉·A·贝尔(无亲属关系)在 Vox ex 中所叙述的那样Machina:会说话的机器的文化史(M.I.T.)。他们从人类的头骨开始,用橡胶、木头、死猫的一部分和被宰杀的羔羊的喉咙设计了一个装置。它可以说,Ow-ah-oo-gamama,比如,你好吗,奶奶?但到目前为止,对能够思考的机器(例如,机械土耳其人)和能够说话的机器(我喜欢将其视为 Owahoogamama 的机器)的追求已经分道扬镳了。尽管威廉·梅克皮斯·萨克雷确实写过一篇关于 Euphonia 的讽刺文章,他想知道如果与查尔斯·巴贝奇的计算机相结合,它是否可以完美地取代,英国财政大臣。
十九世纪后期的工程师和科学家没有建造可以模仿人类嘴巴运动的 Owahoogamamas,而是尝试了可以合成、压缩和传输人类声音的机器。这项研究的历史及其当今最令人惊叹的应用都与残疾有关。(例如,人工智能驱动的语音助手可以让患有肌萎缩侧索硬化症的人说话,即使是用接近自己声音的声音。)亚历山大·格雷厄姆·贝尔的母亲伊丽莎(Eliza)在童年时期曾耳聋,但仍保留了一些听力。她可以通过将一根棍子放在音板上并用牙齿固定住来听钢琴。1864年,他的父亲发明了一种称为可见语音的注音系统;它的字符是嘴和舌头位置的图形表示。
但年轻的亚历山大开始使用这个系统来教聋人说话。1871年,他成为波士顿一所聋人学校的讲师。(贝尔的手语能力很强,但后来他发起反对手语教学的运动,这给聋哑学生带来了残酷的后果;在一些学校,他们的双手被绑在背后。)到 1874 年,他开始在声音的传播:在某种程度上重复了他母亲听钢琴的技巧,他将死者耳朵的骨头附着在一根干草上,然后用干草刮擦烟熏玻璃,记录了死者耳朵骨头的振动,留下了一张唱片的言语。那年夏天,当他在波士顿大学担任声乐生理学和演讲学教授并与他的一名聋哑学生(他们后来结婚)求爱时,他提出了通过电线传输语音的想法。贝尔说,我父亲发明了一个符号,最后,我发明了一种可以看到言语振动的装置,结果证明它是电话。
天啊!它会说话!当巴西皇帝佩德罗第一次在听筒中听到贝尔的声音时,他哭了。贝尔于 1877 年创立了贝尔电话公司,但很少参与其工作。你的丈夫将永远被称为聋哑人的老师,他告诉他的妻子,最终决定不再在电话上浪费时间和金钱。
美国电讯报