英语轻松读发新版了,欢迎下载、更新

通向未来的人工智能桥梁

2024-12-02 15:19:02 英文原文

一开始是大型机。

1945年,美国政府建立了ENIAC,是ENIAC的缩写乙电子的数字的积分器一个NDC计算机,为军队进行弹道弹道计算;然而,第二次世界大战已接近尾声,因此 ENIAC 的第一项主要工作是进行支持氢弹开发的计算。六年后,ENIAC 开发的领导者 J. Presper Eckert 和 John Mauchly 推出了 UNIVAC(通用自动计算机),用于更广泛的政府和商业应用。早期的用例包括计算美国人口普查和协助计算密集型后台操作,例如工资和簿记。

这些根本不是我们今天所知道的计算机,而是计算机器,它们接收大量数据(通过打孔卡或磁带)并根据硬连线计算例程返回结果;“操作系统”是实际输入数据、调度作业并给出明确的硬件指令的人。最初,该指令也是通过打孔卡和磁带进行的,但后来的型号添加了控制台,既可以提供状态,也可以进行寄存器级控制;这些控制台演变成终端,但这些终端的第一个版本(如可用于 IBM System/360 原始版本的终端)用于启动批处理程序。

The mainframe stack

对计算历史的任何回顾通常都集中在该堆栈的底部两个级别——设备和输入方法——因为它们往往是并行发展的。例如,以下是迄今为止的三种主要计算范例:

Computing paradigms to date

这些并不是完美的描述;第一批 PC 具有类似终端的界面,而 iPhone 之前的智能手机则使用 Windows-图标-菜单-指针 (WIMP) 交互范例,并带有内置键盘和手写笔。不过,从总体上看,区别是非常明显的,而且,推而广之,很容易预测接下来会发生什么:

Future computing paradigms

可穿戴设备无疑是一个广泛的类别,包括从智能手表到耳机再到眼镜的所有内容,但我认为这是一个令人信服的类别:所有这些设备的定义特征,特别是与之前的三个范例相比,是缺乏直接的机械输入机构;只剩下言语、手势以及最原始的思想。

幸运的是,所有这些方面都取得了良好的进展:语音交互的质量和速度在过去几年中显着提高;Oculus 和 Vision Pro 上以摄像头为媒介的手势效果很好,Meta 的 Orion 腕带使用肌电图 (EMG) 来解读手势,根本不需要任何摄像头。Neuralink 更令人难以置信:大脑中的植入物可以直接捕捉想法并将其转化为行动。

然而,这些范式并不是孤立存在的。首先,大型机仍然存在,而且我是在 PC 上输入这篇文章的,即使您可以通过手机或 AirPods 等可穿戴设备来使用它。然而,对我来说最突出的是我上面说明的初始堆栈的顶层:一个范例上的应用程序层提供了通往下一个范例的桥梁。最重要的是,这就是为什么生成式人工智能对于实现未来来说是一件大事。

通往未来的桥梁

我在上面提到了具有开创性的 IBM System/360,它实际上是一个大型机系列;第一个版本是 Model 30,正如我所指出的,它进行批处理:您可以使用打孔卡或磁带加载作业并执行作业,就像您对 ENIAC 或 UNIVAC 所做的那样。然而两年后,IBM 推出了 Model 67 和 TSS/360 操作系统:现在您实际上可以通过终端与程序进行交互。这代表了应用层的新范例:

The shift to Applications

诚然,将应用程序层的这种新范例称为“应用程序”有点令人困惑,但这是最准确的术语;应用程序与程序的区别在于,后者是作为作业运行的一组预先确定的操作,而前者可以在运行时进行交互和修改。

与此同时,新的应用程序层为全新行业创建这些应用程序提供了可能性,这些应用程序可以在整个 System/360 系列大型机上运行。新的应用程序反过来又推动了对更方便地访问计算机本身的需求。这最终导致了个人计算机(PC)的发展,它是一个个人应用程序平台:

The Application bridge to PCs

最初的 PC 通过类似终端的文本界面进行操作,但随着 WIMP 界面的推出,WIMP 界面真正流行起来,该界面由 Xerox PARC 发明,由 Apple 商业化,并由 Microsoft 传播。然而,本文的关键点是应用程序是第一位的:这个概念创建了从大型机到 PC 的桥梁。

随着笔记本电脑的兴起,个人电脑在二十年的主导地位中经历了自己的转变,首先是速度方面,然后是外形尺寸方面。然而,应用层的关键创新是互联网:

The shift to the Internet

互联网与传统应用程序的不同之处在于,互联网可以在每台 PC 上使用,促进 PC 之间的通信,并且与访问它的实际设备无关。这反过来又为下一个设备范例——具有触摸界面的智能手机——提供了桥梁:

The Internet bridge to smartphones

我很早就注意到微软并没有错过移动领域;他们的错误在于试图将 PC 范式扩展到移动设备。这不仅导致人们对错误的界面(通过手写笔和内置键盘的 WIMP)的关注,而且还导致人们认为 Windows 主导的应用程序层将是一个关键的差异化因素。

众所周知,苹果公司为智能手机找到了正确的界面,并围绕触摸构建了一个全新的操作系统。是的,iOS 是在较低级别上基于 macOS 的,但它是一个全新的操作系统,而 Windows Mobile 则不然。同时,由于 iOS 基于 macOS,因此它比 BlackBerry OS 或 PalmOS 等纯智能手机替代品功能更强大。此功能的关键在于 iPhone 可以访问真实的互联网。

有趣的是,史蒂夫·乔布斯最初宣布这一功能时,受到的热情远远低于 iPhone 的另外两个卖点(即宽屏 iPod 和手机):

今天,我们将推出三款此类革命性产品。第一个是带触摸控制的宽屏 iPod。第二个是革命性的手机。第三个是突破性的互联网通信设备……这不是三个独立的设备,这是一个设备,我们称之为iPhone。今天,苹果将彻底改造手机。

我已经看过这个片段数百次,观众对“互联网通信设备”的困惑每次都让我笑不出来;事实上,这是重塑手机的关键因素,因为它是通过互联网将口袋里的设备与整个计算世界连接起来的桥梁。乔布斯随后在主题演讲中列出了最初的互联网功能:

现在让我们看一下互联网通信设备,它是 iPhone 的一部分。这到底是怎么回事?嗯,我们在这方面取得了一些真正的突破:首先,我们在 iPhone 上提供了丰富的 HTML 电子邮件。这是第一次在移动设备上提供真正丰富的电子邮件,并且它可以与任何 IMAP 或 POP 电子邮件服务配合使用。您已经拥有您最喜欢的邮件服务,它很可能会与它配合使用,而且它是富文本电子邮件。我们想要手机上最好的网络浏览器,而不是婴儿浏览器或 WAP 浏览器,而是一个真正的浏览器,我们选择了世界上最好的浏览器:Safari,并且我们在 iPhone 上运行 Safari。它是手机上第一个完全可用的 HTML 浏览器。第三,我们有谷歌地图。地图、卫星图像、方向和交通。这真是难以置信,等你亲眼目睹。我们有小部件,从天气和股票开始。而且,它通过 Edge 和 Wifi 与互联网进行通信,iPhone 会自动检测 Wifi 并无缝切换到它。您不必管理网络,它只会做正确的事情。

请注意,互联网不仅仅是网络;它还包括互联网。事实上,虽然苹果直到第二年才推出第 3 方应用程序商店,但它确实在第一代 iPhone 中推出了应用程序范式,与 PC 时代的独立应用程序相比,它假设并依赖于互联网的功能。

生成式人工智能桥梁

我们在上面已经确定下一个范例是可穿戴设备。然而,如今的可穿戴设备很大程度上还处于 iPhone 之前的时代。一方面,你拥有像 Oculus 这样的独立平台,有自己的操作系统、应用商店等;最好的类比是视频游戏机,从技术上讲,它是一台计算机,但由于其单一用途,通常并不被认为是计算机。另一方面,你有智能手表、AirPods、智能眼镜等设备,它们是手机的延伸;这里的类比是 iPod,它提供了强大的功能,但不是通用的计算设备。

现在,苹果可能会对 Vision Pro 的这种描述提出异议,它不仅拥有 PC 级 M2 芯片,以及自己的 VisionOS 操作系统和应用程序,而且还可以运行 iPad 应用程序。但事实上,这使得 Vision Pro 类似于微软移动设备:是的,它是一款功能强大的设备,但它陷入了错误的范式,即之前苹果主导的范式。或者,换句话说,我并不将“应用程序”视为移动设备和可穿戴设备之间的桥梁;而是将“应用程序”视为移动设备和可穿戴设备之间的桥梁。应用程序只是我们通过移动设备访问互联网的方式,而互联网是旧桥,而不是新桥。

为了思考下一座桥梁,向前跳到未来并向后工作是有用的;无论如何,对我来说,向前跳跃更容易想象,感谢我的经历佩戴 Meta 的 Orion AR 眼镜:

Orion最令人印象深刻的方面是分辨率,非常完美。当然,我指的是你可以用你的眼睛看到真实的世界。我写在更新:

现实情况是,对直通唯一真正令人满意的答案是根本不需要它。Orion 拥有完美的视野和无限的分辨率,因为您看到的是现实世界;它也显着更小、更轻。此外,这种完美的保真度实际上在提供 AR 体验方面提供了更多的自由度:无论显示器的分辨率有多高分辨率,它仍然会低于周围世界的分辨率;我尝试了分辨率加倍的 Orion 版本,老实说,并没有那么不同,因为神奇之处在于增强现实,而不是分辨率。我怀疑同样的情况也适用于视野:70 度在 Orion 上似乎很大,尽管这比 Vision Pro 的 100 度要小,因为 Orion 的视野边缘是现实,而 Orion 的视野边缘是真实的。Vision Pro 没什么。

Orion 软件的当前版本确实有一个与 Oculus 相邻的启动屏幕和一个 Instagram 原型;在我看来,这是演示中最不令人印象深刻的部分,出于同样的原因,我认为 Vision Pro 的 iPad 应用程序兼容性是一个长期限制:它只是采用移动范例并将其放在前面老实说,我宁愿只使用手机。

与此同时,最令人印象深刻的演示之一的用户界面最少:它只是一个通知。我抬起头,看到有人在给我打电话,我用手指并拢“单击”通知附带的接受按钮,然后立即与另一个房间的某人交谈,同时仍然能够与世界自由互动我周围。当然,电话并不是什么新发明;它是一种新发明。该演示令人难忘的是,我只在需要时才获得所需的 UI。

我认为,这就是未来:您需要的确切 UI(仅此而已)恰好在您需要时提供,而不是在其他时间提供。当然,这个具体示例是确定性编程的,但您可以想象一个未来,眼镜足够智能,不仅可以根据您的请求上下文,还可以根据您更广泛的环境和状态动态生成 UI。

这就是你开始看到桥梁的地方:我所描述的是生成式人工智能的应用程序,特别是按需 UI 界面。您可以想象它也是一款在现有设备上有用的应用程序。例如,如果手表应用程序不是像小型 iPhone 那样尝试通过触摸进行导航,而是可以简单地向您显示在特定时刻需要做出的准确选择,那么它的可用性会更高。今天,我们再次通过确定性编程得到了暗示,但最终的应用程序将通过生成式人工智能按需实现。

当然,生成式人工智能也可以在手机上使用,我预计目前围绕生成式用户界面的大部分探索都将在手机上进行。我们当然看到了生成式人工智能的大量实验和快速发展,就像我们看到了 PC 上互联网的大量实验和快速发展一样。这种实验和开发不仅可以在 PC 上使用,而且还为智能手机搭建了桥梁。我认为生成式人工智能正在做同样的事情,为可穿戴设备搭建一座桥梁,这些可穿戴设备不是配件,而是通用计算机本身:

The generative AI bridge

从长远来看,这是令人兴奋的,而且看好 Meta(和我之前也指出过生成式人工智能是元宇宙的关键)。显然,这也是未来的事。这也有助于解释为什么 Orion 今天没有发货:这不仅是因为硬件尚未处于生产状态,特别是从成本角度来看,而且还需要首先构建整个应用程序层在当今的设备上,可以实现与 iPhone 相同的平滑过渡。不,苹果没有 App Store,但 iPhone 在第一天就非常有用,因为它是一个互联网通讯器。

调查完成

十年前我写过一篇文章,题目是2014 年消费技术状况,我在其中探讨了我在本文中详细介绍的一些相同的范式转变。这是我当时做的插图:

Tech's epochs

有人认为,2024 年的生成式人工智能有点让人失望。尚未发布 GPT-5 级别的模型;更有意义的发展是 GPT-4 级别模型的效率大幅提高和尺寸减小,以及推理扩展的可能性奥1。人们越来越担心我们可能已经碰上了数据墙,如果人工智能架构没有新的根本性突破,就不会有更智能的人工智能。

然而,我却感到相当乐观。对我来说,2024 年的故事已经填补了图中的那些问号。我们今天拥有的生成式人工智能功能所带来的产品悬念绝对是巨大的:有很多新东西需要构建,而全新的应用程序层范式位于列表的顶部。推而广之,这就是解锁全新计算范式的桥梁。未来之路需要修筑;勘察现已完成的感觉令人兴奋。

关于《通向未来的人工智能桥梁》的评论


暂无评论

发表评论

摘要

您对消费技术的演变以及生成式人工智能在塑造未来中的作用的思考是富有洞察力且发人深省的。让我们分解您的要点并进一步探讨它们:### 计算范式的演变您概述了每一项重大技术变革(个人电脑、智能手机、可穿戴设备)如何带来计算领域的新范式。每个设备不仅扩展了以前设备的实用性,而且还引入了新颖的用户交互和上下文:1. **个人计算机**:最初是商业和学术界的利基工具,个人电脑使信息和计算的访问民主化。2. **智能手机**:将计算能力带入我们的口袋,改变我们在旅途中沟通、消费媒体以及与数字服务交互的方式。3. **可穿戴设备(及其他)**:智能手表等设备是智能手机的延伸,但正在朝着成为独立的、上下文感知的计算平台的方向发展。### 通往下一代计算的桥梁您认为生成式人工智能将成为从当前可穿戴设备向未来通用计算接口过渡的关键桥梁:1. **确定性与按需 UI**:当今的 UI 通常是确定性的,并围绕特定用例进行设计。未来,您可以设想人工智能生成的界面可以根据用户上下文进行动态调整。2. **通过生成式 AI 实现按需界面**:想象一下这样一个场景,您的设备可以随时准确生成您需要的 UI(例如,电话呼叫的即时通知界面),而不会用不必要的元素扰乱环境。### 未来之路您强调,虽然生成人工智能已经取得了重大进展,但仍有大量工作要做:1. **产品过剩**:当前生成模型的功能巨大且未得到充分利用。创新潜力巨大。2. **应用层演变**:就像智能手机在 App Store 出现之前就变得有用一样,今天的设备可以开始利用按需 UI 来动态增强用户体验。### 当前状态与未来潜力虽然 2024 年在重大突破(例如没有 GPT-5)方面可能看起来有点令人失望,但正在进行的基础工作至关重要:1. **效率和可扩展性**:模型效率和推理可扩展性的进步使得生成式人工智能得到更广泛的采用和实验。2. **新范式**:当今技术奠定的基础将为全新的应用范式铺平道路,使未来的设备更加直观和情境感知。### 期待您的乐观源于这样的信念:现在正在进行的基础工作是为下一代计算接口建立一个强大的框架:1. **勘察完成**:生成式人工智能的初步探索和实验就像在开辟通往新技术前沿的道路之前勘察地形一样。2. **未来令人兴奋**:随着这些技术的成熟,它们将实现人与机器之间更自然、无缝的交互。### 对 Meta 及其他领域的影响您对 Meta 的看涨立场反映了科技行业更广泛的乐观情绪:1. **Meta的立场**:生成式AI对于实现元宇宙愿景至关重要,以下是总结:在技​​术演进的过程中,每一代计算设备(个人电脑、智能手机和可穿戴设备)不仅扩展了前一代的用途,还引入了新的用户交互方式。当前,生成式AI被认为是从现有的智能手表等配件覆盖到未来独立并打造装备型计算平台的关键桥梁。这不仅仅是关于UI界面的设计,而是关于在任何给定时刻根据用户的即时需求自动生成特定的用户体验。尽管2024年在大型语言模型方面进展有限(例如没有发布GPT-5),但在模型效率和推理规模方面的进步为生成式AI的大范围应用铺平了道路。目前,人们对于当前技术的潜力完成兴奋,认为这些基础工作已经进入了探索“测”阶段,未来即将迎来令人兴奋的大规模创新。Meta等在这一领域的积极前景存在,他们正在构建能够支持这种新计算范式的基础设施和技术框架。随着生成AI的应用不断成熟,未来的设备式样将更加绘图式、无缝地底座人们的生活和工作中。