通向未来的人工智能桥梁

一开始是大型机。

1945年，美国政府建立了ENIAC，是ENIAC的缩写乙电子的氮数字的我积分器一个NDC计算机，为军队进行弹道弹道计算；然而，第二次世界大战已接近尾声，因此 ENIAC 的第一项主要工作是进行支持氢弹开发的计算。六年后，ENIAC 开发的领导者 J. Presper Eckert 和 John Mauchly 推出了 UNIVAC（通用自动计算机），用于更广泛的政府和商业应用。早期的用例包括计算美国人口普查和协助计算密集型后台操作，例如工资和簿记。

这些根本不是我们今天所知道的计算机，而是计算机器，它们接收大量数据（通过打孔卡或磁带）并根据硬连线计算例程返回结果；“操作系统”是实际输入数据、调度作业并给出明确的硬件指令的人。最初，该指令也是通过打孔卡和磁带进行的，但后来的型号添加了控制台，既可以提供状态，也可以进行寄存器级控制；这些控制台演变成终端，但这些终端的第一个版本（如可用于 IBM System/360 原始版本的终端）用于启动批处理程序。

The mainframe stack

对计算历史的任何回顾通常都集中在该堆栈的底部两个级别——设备和输入方法——因为它们往往是并行发展的。例如，以下是迄今为止的三种主要计算范例：

Computing paradigms to date

这些并不是完美的描述；第一批 PC 具有类似终端的界面，而 iPhone 之前的智能手机则使用 Windows-图标-菜单-指针 (WIMP) 交互范例，并带有内置键盘和手写笔。不过，从总体上看，区别是非常明显的，而且，推而广之，很容易预测接下来会发生什么：

Future computing paradigms

可穿戴设备无疑是一个广泛的类别，包括从智能手表到耳机再到眼镜的所有内容，但我认为这是一个令人信服的类别：所有这些设备的定义特征，特别是与之前的三个范例相比，是缺乏直接的机械输入机构；只剩下言语、手势以及最原始的思想。

幸运的是，所有这些方面都取得了良好的进展：语音交互的质量和速度在过去几年中显着提高；Oculus 和 Vision Pro 上以摄像头为媒介的手势效果很好，Meta 的 Orion 腕带使用肌电图 (EMG) 来解读手势，根本不需要任何摄像头。Neuralink 更令人难以置信：大脑中的植入物可以直接捕捉想法并将其转化为行动。

然而，这些范式并不是孤立存在的。首先，大型机仍然存在，而且我是在 PC 上输入这篇文章的，即使您可以通过手机或 AirPods 等可穿戴设备来使用它。然而，对我来说最突出的是我上面说明的初始堆栈的顶层：一个范例上的应用程序层提供了通往下一个范例的桥梁。最重要的是，这就是为什么生成式人工智能对于实现未来来说是一件大事。

通往未来的桥梁

我在上面提到了具有开创性的 IBM System/360，它实际上是一个大型机系列；第一个版本是 Model 30，正如我所指出的，它进行批处理：您可以使用打孔卡或磁带加载作业并执行作业，就像您对 ENIAC 或 UNIVAC 所做的那样。然而两年后，IBM 推出了 Model 67 和 TSS/360 操作系统：现在您实际上可以通过终端与程序进行交互。这代表了应用层的新范例：

The shift to Applications

诚然，将应用程序层的这种新范例称为“应用程序”有点令人困惑，但这是最准确的术语；应用程序与程序的区别在于，后者是作为作业运行的一组预先确定的操作，而前者可以在运行时进行交互和修改。

与此同时，新的应用程序层为全新行业创建这些应用程序提供了可能性，这些应用程序可以在整个 System/360 系列大型机上运行。新的应用程序反过来又推动了对更方便地访问计算机本身的需求。这最终导致了个人计算机（PC）的发展，它是一个个人应用程序平台：

The Application bridge to PCs

最初的 PC 通过类似终端的文本界面进行操作，但随着 WIMP 界面的推出，WIMP 界面真正流行起来，该界面由 Xerox PARC 发明，由 Apple 商业化，并由 Microsoft 传播。然而，本文的关键点是应用程序是第一位的：这个概念创建了从大型机到 PC 的桥梁。

随着笔记本电脑的兴起，个人电脑在二十年的主导地位中经历了自己的转变，首先是速度方面，然后是外形尺寸方面。然而，应用层的关键创新是互联网：

The shift to the Internet

互联网与传统应用程序的不同之处在于，互联网可以在每台 PC 上使用，促进 PC 之间的通信，并且与访问它的实际设备无关。这反过来又为下一个设备范例——具有触摸界面的智能手机——提供了桥梁：

The Internet bridge to smartphones

我很早就注意到微软并没有错过移动领域;他们的错误在于试图将 PC 范式扩展到移动设备。这不仅导致人们对错误的界面（通过手写笔和内置键盘的 WIMP）的关注，而且还导致人们认为 Windows 主导的应用程序层将是一个关键的差异化因素。

众所周知，苹果公司为智能手机找到了正确的界面，并围绕触摸构建了一个全新的操作系统。是的，iOS 是在较低级别上基于 macOS 的，但它是一个全新的操作系统，而 Windows Mobile 则不然。同时，由于 iOS 基于 macOS，因此它比 BlackBerry OS 或 PalmOS 等纯智能手机替代品功能更强大。此功能的关键在于 iPhone 可以访问真实的互联网。

有趣的是，史蒂夫·乔布斯最初宣布这一功能时，受到的热情远远低于 iPhone 的另外两个卖点（即宽屏 iPod 和手机）：

今天，我们将推出三款此类革命性产品。第一个是带触摸控制的宽屏 iPod。第二个是革命性的手机。第三个是突破性的互联网通信设备……这不是三个独立的设备，这是一个设备，我们称之为iPhone。今天，苹果将彻底改造手机。

我已经看过这个片段数百次，观众对“互联网通信设备”的困惑每次都让我笑不出来；事实上，这是重塑手机的关键因素，因为它是通过互联网将口袋里的设备与整个计算世界连接起来的桥梁。乔布斯随后在主题演讲中列出了最初的互联网功能：

现在让我们看一下互联网通信设备，它是 iPhone 的一部分。这到底是怎么回事？嗯，我们在这方面取得了一些真正的突破：首先，我们在 iPhone 上提供了丰富的 HTML 电子邮件。这是第一次在移动设备上提供真正丰富的电子邮件，并且它可以与任何 IMAP 或 POP 电子邮件服务配合使用。您已经拥有您最喜欢的邮件服务，它很可能会与它配合使用，而且它是富文本电子邮件。我们想要手机上最好的网络浏览器，而不是婴儿浏览器或 WAP 浏览器，而是一个真正的浏览器，我们选择了世界上最好的浏览器：Safari，并且我们在 iPhone 上运行 Safari。它是手机上第一个完全可用的 HTML 浏览器。第三，我们有谷歌地图。地图、卫星图像、方向和交通。这真是难以置信，等你亲眼目睹。我们有小部件，从天气和股票开始。而且，它通过 Edge 和 Wifi 与互联网进行通信，iPhone 会自动检测 Wifi 并无缝切换到它。您不必管理网络，它只会做正确的事情。

请注意，互联网不仅仅是网络；它还包括互联网。事实上，虽然苹果直到第二年才推出第 3 方应用程序商店，但它确实在第一代 iPhone 中推出了应用程序范式，与 PC 时代的独立应用程序相比，它假设并依赖于互联网的功能。

生成式人工智能桥梁

我们在上面已经确定下一个范例是可穿戴设备。然而，如今的可穿戴设备很大程度上还处于 iPhone 之前的时代。一方面，你拥有像 Oculus 这样的独立平台，有自己的操作系统、应用商店等；最好的类比是视频游戏机，从技术上讲，它是一台计算机，但由于其单一用途，通常并不被认为是计算机。另一方面，你有智能手表、AirPods、智能眼镜等设备，它们是手机的延伸；这里的类比是 iPod，它提供了强大的功能，但不是通用的计算设备。

现在，苹果可能会对 Vision Pro 的这种描述提出异议，它不仅拥有 PC 级 M2 芯片，以及自己的 VisionOS 操作系统和应用程序，而且还可以运行 iPad 应用程序。但事实上，这使得 Vision Pro 类似于微软移动设备：是的，它是一款功能强大的设备，但它陷入了错误的范式，即之前苹果主导的范式。或者，换句话说，我并不将“应用程序”视为移动设备和可穿戴设备之间的桥梁；而是将“应用程序”视为移动设备和可穿戴设备之间的桥梁。应用程序只是我们通过移动设备访问互联网的方式，而互联网是旧桥，而不是新桥。

为了思考下一座桥梁，向前跳到未来并向后工作是有用的；无论如何，对我来说，向前跳跃更容易想象，感谢我的经历佩戴 Meta 的 Orion AR 眼镜：

Orion最令人印象深刻的方面是分辨率，非常完美。当然，我指的是你可以用你的眼睛看到真实的世界。我写在更新:

现实情况是，对直通唯一真正令人满意的答案是根本不需要它。Orion 拥有完美的视野和无限的分辨率，因为您看到的是现实世界；它也显着更小、更轻。此外，这种完美的保真度实际上在提供 AR 体验方面提供了更多的自由度：无论显示器的分辨率有多高分辨率，它仍然会低于周围世界的分辨率；我尝试了分辨率加倍的 Orion 版本，老实说，并没有那么不同，因为神奇之处在于增强现实，而不是分辨率。我怀疑同样的情况也适用于视野：70 度在 Orion 上似乎很大，尽管这比 Vision Pro 的 100 度要小，因为 Orion 的视野边缘是现实，而 Orion 的视野边缘是真实的。Vision Pro 没什么。

Orion 软件的当前版本确实有一个与 Oculus 相邻的启动屏幕和一个 Instagram 原型；在我看来，这是演示中最不令人印象深刻的部分，出于同样的原因，我认为 Vision Pro 的 iPad 应用程序兼容性是一个长期限制：它只是采用移动范例并将其放在前面老实说，我宁愿只使用手机。

与此同时，最令人印象深刻的演示之一的用户界面最少：它只是一个通知。我抬起头，看到有人在给我打电话，我用手指并拢“单击”通知附带的接受按钮，然后立即与另一个房间的某人交谈，同时仍然能够与世界自由互动我周围。当然，电话并不是什么新发明；它是一种新发明。该演示令人难忘的是，我只在需要时才获得所需的 UI。

我认为，这就是未来：您需要的确切 UI（仅此而已）恰好在您需要时提供，而不是在其他时间提供。当然，这个具体示例是确定性编程的，但您可以想象一个未来，眼镜足够智能，不仅可以根据您的请求上下文，还可以根据您更广泛的环境和状态动态生成 UI。

这就是你开始看到桥梁的地方：我所描述的是生成式人工智能的应用程序，特别是按需 UI 界面。您可以想象它也是一款在现有设备上有用的应用程序。例如，如果手表应用程序不是像小型 iPhone 那样尝试通过触摸进行导航，而是可以简单地向您显示在特定时刻需要做出的准确选择，那么它的可用性会更高。今天，我们再次通过确定性编程得到了暗示，但最终的应用程序将通过生成式人工智能按需实现。

当然，生成式人工智能也可以在手机上使用，我预计目前围绕生成式用户界面的大部分探索都将在手机上进行。我们当然看到了生成式人工智能的大量实验和快速发展，就像我们看到了 PC 上互联网的大量实验和快速发展一样。这种实验和开发不仅可以在 PC 上使用，而且还为智能手机搭建了桥梁。我认为生成式人工智能正在做同样的事情，为可穿戴设备搭建一座桥梁，这些可穿戴设备不是配件，而是通用计算机本身：

The generative AI bridge

从长远来看，这是令人兴奋的，而且看好 Meta（和我之前也指出过生成式人工智能是元宇宙的关键）。显然，这也是未来的事。这也有助于解释为什么 Orion 今天没有发货：这不仅是因为硬件尚未处于生产状态，特别是从成本角度来看，而且还需要首先构建整个应用程序层在当今的设备上，可以实现与 iPhone 相同的平滑过渡。不，苹果没有 App Store，但 iPhone 在第一天就非常有用，因为它是一个互联网通讯器。

调查完成

十年前我写过一篇文章，题目是2014 年消费技术状况，我在其中探讨了我在本文中详细介绍的一些相同的范式转变。这是我当时做的插图：

有人认为，2024 年的生成式人工智能有点让人失望。尚未发布 GPT-5 级别的模型；更有意义的发展是 GPT-4 级别模型的效率大幅提高和尺寸减小，以及推理扩展的可能性奥1。人们越来越担心我们可能已经碰上了数据墙，如果人工智能架构没有新的根本性突破，就不会有更智能的人工智能。

然而，我却感到相当乐观。对我来说，2024 年的故事已经填补了图中的那些问号。我们今天拥有的生成式人工智能功能所带来的产品悬念绝对是巨大的：有很多新东西需要构建，而全新的应用程序层范式位于列表的顶部。推而广之，这就是解锁全新计算范式的桥梁。未来之路需要修筑；勘察现已完成的感觉令人兴奋。

OC

通向未来的人工智能桥梁

通往未来的桥梁

生成式人工智能桥梁

调查完成

关于《通向未来的人工智能桥梁》的评论

发表评论

摘要

相关新闻

相关讨论