英语轻松读发新版了,欢迎下载、更新

“寒武纪大爆发”:人工智能对你手机的彻底重塑即将到来 - CNET

2024-09-22 13:00:00 英文原文

“寒武纪大爆发”:人工智能将彻底重塑你的手机,即将推出

得益于人工智能,智能手机将更好地满足你的需求。这只是初学者。

在《西部世界》和《苍穹浩瀚》等科幻剧中,角色使用具有时尚透明设计的进化移动设备,可以根据需要投射全息图或神奇地改变其界面。

<异想天开?或许。但智能手机即将实现飞跃。

今天,科技巨头正在为人工智能的进步做好准备,这将推动智能手机很快进入下一个时代。专家表示,在未来几年内,我们的手机将更加直观、实用,甚至友好。这种转变不仅会让手机以多年来从未有过的方式感到新鲜有趣,而且还可以让我们从沉浸在屏幕中解放出来。

就在上周,苹果发布了 iPhone 16 和 iPhone16Pro,它宣称这是第一款为该公司新的人工智能系统 Apple Intelligence 打造的 iPhone。新手机包括一个用于触发相机的专用按钮和“视觉智能”,这是一种人工智能驱动的相机模式,让您只需将手机指向并按下按钮即可了解您的环境。

未来苹果、OpenAI、三星和谷歌等公司正在规划,你的手机摄像头将不仅仅用于自拍或记录你的假期,它将成为你了解周围世界的更广阔的窗口。苹果即将推出的视觉智能功能只是一个例子。

而这只是一个起点。量化未来学家、今日未来研究所创始人兼首席执行官艾米·韦伯 (Amy Webb) 表示,她看到“数量惊人”的新设备、专利和融资轮次涉及无屏幕的新技术设备,并补充说,我们所知道的手机最终可能“淡入背景。”她将其比作数百万年前的进化爆发,引入了种类繁多的动物。

“目前,我们正处于设备和传感器寒武纪爆发的开始,”她说。

在本文中:

目前,在可预见的未来,大多数智能手机将继续看起来像我们今天随身携带的玻璃和金属板(抱歉,没有全息图或可见-还需要通过屏幕)。但它们会在我们需要时更好地呈现信息,几乎就像《苍穹浩瀚》中设备上显示的适应性软件一样。您可能会发现自己只需对着手机说话即可完成工作,而不是不断地在应用程序之间跳转并浏览菜单。或者更好的是,您的手机屏幕可能会准确显示您所需要的内容,甚至无需您询问。

“我的自上而下的观点是,从长远来看,我想要一部您永远不需要的手机进入设置菜单,”三星执行副总裁兼客户体验主管 Patrick Chomet 告诉我。“您不必知道任何功能的名称。我们也不必为它们命名,因为设备将拥有足够的智能和上下文来支持您想要执行的操作。”

与技术高管、分析师和未来学家交谈,并根据我自己尝试新设备和尖端虚拟助手的经验,描绘了智能手机的发展方向。

人工智能的到来带来了新的活力智能手机的生活

当世界上大多数人都拥有智能手机时,在口袋里拥有一台超级计算机的想法并不像以前那样新颖。现在比以往任何时候都更难让消费者对像折叠手机这样具有创新性的新手机感到兴奋,它们并没有真正激发消费者的热情。有数据可以证明这一点。根据 CNET 9 月份根据 YouGov 收集的数据进行的一项调查显示,44% 的智能手机用户仅在手机损坏或需要更换时才升级手机。

同一项调查还表明,消费者会保留自己的手机手机的使用期限为三年或更长时间,这与 Verizon 首席执行官 Hans Vestberg 7 月份向 CNBC 发表的评论一致,即用户保留手机的时间超过 36 个月。据 Counterpoint 称,尽管智能手机市场今年开始反弹,但销量在 2023 年达到近十年来的最低点。

“智能手机已经商品化,因此它们都相当相似,”Webb 说。“尽管有两种不同的主要操作系统,但它们也并非完全不同。”

但在 2022 年底 ChatGPT 爆炸式推出后,智能手机制造商看到了人工智能的机会为我们的智能手机开辟一条新道路。第一波生成式人工智能功能主要集中在非常具体的用例上,例如编辑照片、总结文字记录或翻译对话。尽管这些工具可能很小众,但它们为智能手机体验带来了近年来非常缺乏的东西:感觉真正新颖的功能,例如只需点击几下即可从头开始创建图像的功能。

然而,这只是技术领导者认为智能手机增长的更重大突破的开始。下一阶段人工智能驱动的更新可能为未来奠定基础,在未来,我们不需要打开尽可能多的应用程序、菜单或服务来在手机上完成工作。

这是一个转变,据 Counterpoint Research 称,谷歌 Android 生态系统总裁 Sameer Samat 和 Gemini 体验副总裁兼总经理 Sissie Hsiao 一直在思考很多问题,考虑到 Android 为全球近 80% 的智能手机提供支持,这一点很重要。

Samat 告诉我谷歌如何“重建”Android,人工智能是这一切的中心,当然,Gemini 公司的人工智能助手是明星。

“这不是你的不再是传统的助理了,”Hsiao 说。“这确实有能力做新事情。”

手机有眼睛(和声音)

生成式人工智能的进步使虚拟助手比 Siris 和 Alexa 更加智能、更具对话性过去的岁月。支持语音的助手不再只是回答问题,而是变得更加自然、更有说服力。

OpenAI 的 ChatGPT 产品负责人 Nick Turley 认为,与我们的设备对话也将以同样的方式从小众走向主流聊天机器人在过去两年中取得了巨大的进步。

“一年后,我怀疑语音可能是人们使用 [ChatGPT] 的主要方式,”他说。

这是也不再只是言语;科技公司和手机制造商也希望我们的设备能够更好地“看到”我们周围的环境。在 9 月 9 日的苹果年度设备发布会上,这一信息得到了明确传达,当时苹果公司在 iPhone 16 上推出了一项名为“视觉智能”的新功能。

按下 iPhone 16 的新相机控制按钮,您就可以“您可以将手机对准一家餐厅并找到其营业时间,或者扫描传单以查找活动并将其添加到您的日历中。屏幕上还有一些按钮,用于根据您的照片启动 Google 搜索或向 ChatGPT 询问图像信息。根据苹果公司预先录制的演示,它看起来像是 iPhone 的一种新型视觉界面,它依靠摄像头作为主要输入方式,而不是打开应用程序并打字或滑动。

Apple是最新一家探索此类想法的科技公司。五月,OpenAI 展示了聊天机器人如何识别数学方程并实时提供提示,就像虚拟数学导师一样,只需将手机指向问题即可。Google 的 Gemini 助手可以分析 YouTube 视频的内​​容并回答相关问题。

对于 Google 而言,Gemini 目前的功能正在为更雄心勃勃地重新思考虚拟助手 Project Astra 奠定基础。原型数字助理可以使用手机的摄像头“看到”和“理解”您周围的环境,并将这些数据与语音输入相结合来处理请求。

在 5 月份 Google 开发者大会上展示的视频中,用户指出将电话对准某人办公桌上的扬声器,在电话屏幕上画一个箭头,指向扬声器的特定部分,然后询问:“扬声器的那个部分叫什么?”阿斯特拉回应说这是一个高音扬声器,并解释了该组件的用途。CNET 的 Lexy Savvides 在 Google I/O 上短暂试用了 Google 的 Project Astra 演示,并亲眼目睹了它如何根据镜头前的动物照片生成故事。

“[Gemini Live] 确实是一个开始Hsiao 表示,Astra 背后的技术将首先在智能手机上的 Gemini 中得到广泛应用,但她没有具体说明发布时间。“在 Gemini Live 中,您可以与它说话;它会向您回复。我们设想将 Astra 与此结合起来,打开摄像头,这样它也可以通过全音频音频看到您并与您互动。”

这一切开始感觉更像是科幻小说,事实上 OpenAI 发现自己陷入了困境,因为有人指责它抄袭了斯嘉丽·约翰逊 (Scarlett Johansson) 的声音,她在 2013 年斯派克·琼斯 (Spike Jonze) 的电影《她》(Her) 中扮演了令人震惊的类人虚拟助理,ChatGPT 的一位声音。

风险投资公司 CRV 的普通合伙人萨尔·古尔 (Saar Gur) 专门寻找那些倾向于消费者行为转变的公司,他认为语音交互作为一种计算界面被“低估”了今天。他相信与人工智能代理交谈将越来越成为常态。

“与‘让我用谷歌搜索一下’相比,这种语音[助手]将进入你我之间的对话,这将变得更加常见。”Gur 说。

更进一步,Gur 看到了 AI 角色有机会以不同于今天的方式提供娱乐和陪伴。他提到了他十几岁的儿子,他经常在 Discord 上与其他游戏玩家聊天,作为一个假设的例子,说明人工智能化身不仅可以用于检索信息。

“他的许多朋友都是他从未见过的人。见面了,”他说。“现在的想法是,现在的聊天机器人对他来说实际上可以更安全地进行交互,因为它们不是真正的人,可以获取他的密码并将其分享到其他地方。”

而且他不是独自的;企业家 Avi Schiffmann 在 7 月份因开发一款智能挂件而成为头条新闻,该挂件带有名为 Friend 的嵌入式人工智能助手,专为友谊而设计。

更智能的软件

适用于具有“智能”功能的设备从他们的名字来看,今天的手机并不总是让人感觉很智能。在涉及基本任务时,用户需要做很多工作,例如切换设置和赶上通知。

“在大多数情况下,交互过程仍然是非常手动的,”韦伯说。“它要求你看着屏幕并输入一些内容。”

但科技公司认为人工智能可能是解决这个问题的关键,它可以阻止我们埋头于手机中一如既往。这是 Apple Intelligence 的关键原则之一,该功能将于下个月开始推出,视觉智能和其他先前宣布的功能就证明了这一点。

Apple 升级后的 Siri 配备了有关 Apple 产品设置的知识,这应该使其成为个人 IT 部门和副驾驶,用于导航您的设备等。Apple 已有 13 年历史的虚拟助手还将能够在应用程序中为你采取行动,并且能够更好地理解手机上存储的信息背后的上下文,使其能够回答新类型的问题。

该公司 6 月份的全球开发者大会上展示的一个例子涉及向 Siri 询问诸如“我妈妈的航班什么时候降落?”之类的问题。并交叉参考电子邮件和实时航班跟踪。然后,您可以跟进诸如“我们的午餐计划是什么?”之类的问题。并让 Siri 从短信中提取详细信息。

ChatGPT 如今以提供类似人类的对话式响应而闻名,Turley 说,它也可能会发展到代表你做更多事情。

“虽然 ChatGPT 已经开始做一些事情,比如创建图像或执行任务,但在许多情况下,[它]仍然给你回短信,”他说。“我认为,ChatGPT 会在五年内代表您执行操作,而不仅仅是做出响应。”

三星高管 Chomet 对人工智能如何制造我们的手机有着大胆的想法更容易使用。他的长期目标是让用户永远不必再打开三星手机上的设置菜单。该公司的方法是在三星设备上制作各种“接触点”,即我们与之交互的操作系统部分,例如足够智能的键盘和摄像头,以预测用户想要什么。

他承认 Galaxy 手机已经在这样做,例如键盘,它现在包含用于文本翻译和重写消息的内置工具。接下来是操作系统的其他方面,例如三星手机上的小部件、通知、锁定屏幕和设置菜单。

Chomet 看到了一个你甚至不需要考虑下一步该做什么的未来。在你的手机上。

“[你]永远不必进入设置,或者你永远不必寻找下一步操作,”他说。“你可能不需要打开[一个]应用程序。”

这是 OpenAI、谷歌、三星和苹果以外的公司正在努力解决的一个问题。例如,初创公司 Brain.ai 开发了智能手机软件,该软件可以根据手头的任务组装界面,而不是在应用程序之间来回切换。

我的同事凯蒂·柯林斯 (Katie Collins) 在今年早些时候看到了这项技术的实际应用在世界移动大会上的一次演示中,Brain.ai 首席执行官 Jerry Yue 只是要求手机为两人预订头等舱航班。手机可以为航班选择、预订和支付流程提供必要的信息,而无需打开和关闭不同的应用程序和窗口。

还有 Rabbit,这家热闹的人工智能初创公司在 2019 年引起了广泛关注。一月份的 CES 技术大会上展示了其手持式 AI 语音助手 Rabbit R1。然而,当该设备于 4 月份推出时,评论者(包括 CNET)批评该设备性能错误且功能有限。

但该公司创始人兼首席执行官 Jesse Lyu 仍然坚信 R1 代表着向未来,人工智能只需提出要求即可为我们处理一切。下周,Rabbit R1 将获得一项名为 LAM Playground 的新功能,Lyu 声称该功能将使其能够回答复杂的基于网络的请求,这些请求涉及将多个想法串在一起,例如:“前往 Reddit,搜索电视的最佳推荐2024 年,然后去百思买订购。”

他的问题不是智能手机本身,而是以应用程序为中心的操作系统,感觉很过时。

<“我们并不是说,‘嘿,R1 第一天就比 iPhone 更好,”Lyu 在接受 CNET 采访时说道。“我们认为这样说真的非常错误,但我们坚信这个基于应用程序的系统将在未来消失。”

他还没有排除最终构建一个实际的系统的可能性。由人工智能驱动的 Rabbit 手机,尽管他也没有说公司正在开发一款手机。

当被问及我们未来是否会看到一款无应用程序的 Rabbit 手机时,他说道:“这绝对是可能的”,并补充说他“对 R1 的策略零遗憾。”

人工智能拥有巨大的潜力和大问题

但实现这个未来并不容易。生成式人工智能已经引发了一些严重的问题:我们是否已经准备好迎接这样一个世界:在这个世界中,您只需按一下按钮即可操纵和创建图像,就像 Google 和三星最新手机上已经提供的工具一样。

谷歌在对 CNET 的评论中表示,这些工具旨在提高创造力和创造力。旨在“尊重用户提示的意图”,这意味着它们可能会创建“在用户指示时可能会冒犯的内容。”

“也就是说,这并不是什么都可以”,该声明说。“我们对允许和不允许哪些内容有明确的政策和服务条款,并建立了防止滥用的护栏。有时,一些提示可能会挑战这些工具的护栏,我们仍然致力于不断增强和完善我们所采取的保障措施。”

这只是一个潜在的问题。还有一个问题是,这些人工智能聊天机器人和助手背后的公司使用网络内容训练模型是否侵犯了版权。此外,大型语言模型为生成型人工智能聊天机器人提供动力的底层模型往往会时不时地吐出虚假信息,这使得人们很难甚至不可能信任它们。在我在 Pixel 9 上测试 Gemini Live 期间,Google 的聊天机器人不止一次提供了错误答案。

“它根据对语言的了解、对事件的了解进行概括或推断南加州大学维特比工程学院计算机科学助理教授、数据集、可解释性、语言和学习实验室的负责人 Swabha Swayamdipta 在之前接受 CNET 采访时表示。“这就是为什么这些语言模型产生的事实看起来似乎有道理,但并不完全正确,因为它们没有经过训练来准确地产生他们以前见过的东西。”

Turley 表示,在这方面正在取得进展。这一领域,特别是当 ChatGPT 学会使用外部信息来处理查询而不是仅仅依靠自己的知识时。但在这些模型达到 100% 可靠之前,尚不清楚何时以及是否会发生,他表示用户应该对 ChatGPT 关于敏感主题的答案进行事实核查。

“因为即使是 90% 的可靠性,我们也已经做了很多工作每一代模型在这个主题上取得的进展,仍然并不意味着你应该盲目地信任人工智能。”Turley 说。

接下来的问题是,公众是否关心新的人工智能功能。数据表明,大多数人对目前手机的工作方式感到满意。

CNET 调查中有四分之一的受访者表示,他们认为人工智能功能没有帮助,并且不希望看到更多的人工智能功能集成到他们的手机中手机,而 45% 的人表示他们不愿意支付人工智能工具的订阅费。

34% 的人表示,尽管他们做出了努力,但在移动设备上使用人工智能时,他们担心隐私问题。苹果、谷歌和三星等公司通过在设备本地运行某些人工智能功能而不将信息发送到云端来保护隐私。对于要求太高而无法在设备本身上处理的请求,苹果公司使用了一种名为“私有云计算”的系统,该系统声称该系统仅将与当前特定任务相关的数据发送到苹果服务器,从而增强隐私性。三星手机的设置菜单中还有一个开关,可让您关闭 Galaxy AI 功能的基于云的处理。

新的生成式 AI 功能是否会受到消费者的欢迎,将取决于手机制造商如何使用这项技术旨在创造新的方法,使存储在我们设备上的海量信息(从位置数据到消息)变得更容易接受和有用。这样做可以使特定用户的体验更加个性化和个性化,从而有可能将新手机上的人工智能功能与可以在任何设备上访问的基于云的人工智能模型区分开来。

“你真的必须说明原因市场研究公司 Gartner 的高级总监兼分析师乔恩·埃伦森 (Jon Erensen) 表示:“你想在设备上执行这些操作。”

未来的设备

除非出现意外情况,例如ChatGPT 未来学家和技术高管的划时代首次亮相对智能手机发展的总体方向有了一定的了解。尽管他们的理论不同,但有一个共同点。随着手机和外围设备变得更加智能并且能够更好地理解我们的意图,我们会发现自己对屏幕的依赖越来越少。人工智能,无论是提供新型接口还是充当我们的手机和未来设备之间的结缔组织,都将发挥重要作用。

在过去的十年中,智能手机已经转向作为我们周围无数互联设备的枢纽,例如智能手表、无线耳塞、智能戒指和互联眼镜。Chomet 和其他技术领导者认为,设备网络是这一转变的关键部分,我们不再需要以同样的方式手动操作手机。

在不太可能的情况下,在遥远的未来,虚拟助手可能会在各种设备之间徘徊,并在任何有意义的设备上回答您的请求。The Expanse 手持终端背后的理念与此类似,其主要设计目的是作为用户环境中其他传感器和设备的接触点。

“它不与设备相连,”Chomet 说。“智能代理可以识别你的意图,无论你是通过语音说出,还是我可以输入相同的内容。”

这听起来可能与今天的耳塞没有太大不同,耳塞已经配备了虚拟助手比如 Siri 和 Google Gemini。但 Chomet 描述的场景只是自由地说话,而不是有意识地思考你正在与哪个小工具交谈。大型语言模型可以简单地说“那是什么?”当你在咖啡店里听到一首歌曲时,你不必说“嘿 Google,这是什么歌?”Chomet 说道。

技术顾问兼 Amazon Prime 视频系列《未来主义者》的主持人伊恩·汗 (Ian Khan) 也认为,我们将越来越多地被更多智能设备所包围,例如联网眼镜甚至智能珠宝。尤其是智能眼镜已经开始展现出前景,尤其是 Meta 的第二代雷朋眼镜,我的同事 Scott Stein 称其为“最好的人工智能伴侣”。谷歌的 Project Astra 演示还引发了人们的疑问:谷歌眼镜(该公司于 2012 年推出的配备摄像头和麦克风的眼镜)是否该卷土重来。

“这很有趣,因为它就像完美的硬件,”谷歌联合创始人谢尔盖·布林在今年的 I/O 大会上向包括 CNET 在内的一群记者发表讲话时谈到了这个话题。“10 年后,它就像现在的杀手级应用。”

但如果 2024 年教会了我们什么的话,那就是我们还没有准备好迎接一个完全超越智能手机的世界。围绕人工智能创建新的语音优先设备的尝试,例如 Rabbit R1 和 Humane AI Pin,这些产品的灵感似乎来自 Pokdex 和《星际迷航》通讯器徽章等一些最受欢迎的虚构小玩意,但遭到了广泛批评。达到了发布时的预期,尽管此后它们都进行了重大更新。虽然像汗和韦伯这样的未来学家看到了一个我们不再那么依赖发光矩形的世界,但传统的智能手机可能不会很快消失。

“未来的许多变化都将韦伯说。

然而,我们的手机可以更好地理解我们的意图并阻止我们在应用程序之间来回切换吗?Chomet 表示,这种未来几乎已经到来,他预测这种转变可能会在未来一到三年内发生。到那时,生成式人工智能可能甚至不像今天那么新颖,而更像是一种基本但必不可少的实用程序。

“你不会说,‘我的手机有互联网’,或者‘我的电脑是通过互联网供电的,’”乔梅特说。“所以我认为一年之内,人工智能就会变成那样。”

视觉设计师 |Zoey Liao、Cole Kan

高级动画设计师 |杰弗里·黑兹尔伍德

创意总监 |Viva Tung

视频制作人 |杰西·奥拉尔

视频执行制片人 |安迪·奥特曼

项目经理 |丹妮尔·拉米雷斯

内容总监 |乔纳森·斯基林斯

编辑 |科琳·赖克特

关于《“寒武纪大爆发”:人工智能对你手机的彻底重塑即将到来 - CNET》的评论


暂无评论

发表评论

摘要

“寒武纪大爆发”:人工智能将彻底重塑你的手机,即将到来得益于人工智能,智能手机将更好地满足你的需求。下一阶段人工智能驱动的更新可能为未来奠定基础,在未来,我们不需要打开那么多应用程序、菜单或服务来在手机上完成工作。“一年后,我怀疑语音可能是人们使用 [ChatGPT] 的主要方式,”他说。生成式人工智能已经引发了一些严重的问题:我们是否已经准备好迎接这样一个世界:在这个世界中,只需按一下按钮即可操纵和创建图像,就像谷歌和三星最新手机上已经提供的那样。10 年后,它就像现在的杀手级应用程序。