作者:Kif Leswing
2024年9月20日,在英国伦敦摄政街的一家苹果零售店展示的全新iPhone 16的景象。
拉斯伊德·内卡蒂·阿斯利姆 | 安纳杜卢 | 盖帝图像
作为苹果公司为了使苹果智能进军硅谷的人工智能竞赛,它依赖于其最强的优势之一:它拥有3400万应用开发者。
iPhone用户将在本月晚些时候首次体验到苹果公司的AI系统——Apple Intelligence。该公司将依赖Apple Intelligence作为其最新一代智能手机iPhone 16的主要卖点。
苹果的人工智能不如最先进的实验室(如OpenAI的ChatGPT等竞争对手)所研发的技术先进。谷歌的双子座和Meta的 llama。苹果并没有使用最大的模型,也无法像一些前沿的语音模型那样展示一些令人惊叹的特技——比如OpenAI最新的模型可以唱歌。
苹果希望通过其AI与众不同的地方在于,Siri实际上可以在你的手机上执行一些操作——发送电子邮件、解析日历和拍摄及编辑照片。这是其他公司的AI聊天机器人目前无法做到的,为了实现这一目标,苹果正在召唤其第三方开发者的团队来调整他们的应用程序以与Apple Intelligence协作。最终,Siri可能会触发任何用户在应用中可以进行的操作,这符合该公司对Siri的长期愿景。苹果公司在六月表示。
苹果的凯尔西·彼得森(机器学习总监)在苹果智能发布的视频中表示:“Siri 将能够在应用程序内和跨应用执行数百种新的操作。”
苹果可以轻松为其自有应用实现这一点,但为了让苹果智能与数以百万计的非苹果应用互动,它需要开发者拥抱一种新的编程方式。这意味着开发者将需要为他们的应用创建多达数百个额外的代码片段,这些代码片段被称为App Intent。
苹果公司有着强大的历史,能够促使开发者支持新的平台倡议,并且它正在运行一套成熟的策略来吸引他们加入——包括开发关系部门的个人关注,在公司的年度开发者大会上营造派对般的氛围,最重要的是,它提供应用商店推广,这种推广可以使及时加入的开发者获得数以百万计的下载量。
如果第三方开发者加入并且Siri系统如其所宣称的那样运行,它可能代表了苹果在人工智能竞赛中最大的和最持久的优势之一。
“你应该能够将各种功能串联起来,基本上可以实现我们所有人所设想的未来,在这个未来中你可以用对话的方式使用Siri来一次性完成很多事情,”iOS开发者乔丹·摩根说道。写了一个教程关于App意图。
苹果能否说服其数以百万计的开发者是一个关键问题,这对公司来说至关重要。
该公司依赖于苹果智能,该功能仅适用于去年发布的iPhone 15 Pro或今年发布的iPhone 16型号,以刺激一波升级潮并提振疲软的iPhone销量。如果改进后的Siri得不到开发者的良好支持或者无法给用户留下深刻印象,它可能会冷却iPhone的销售,并导致客户最终选择通过应用程序使用竞争对手的语音助手,而不是内置的Siri。
苹果智能照片
苹果公司
在音乐应用内,苹果构建了大约10种意图,包括诸如“添加到播放列表”、“播放音乐”或“选择音乐”等操作。一个应用程序的意图应该定义单一的操作,程序员表示。
摩根表示,例如,如果使用一款咖啡因跟踪应用,一个意图是能够显示用户今天记录的咖啡因总量的概览。
当该应用意图完成时,苹果的各种“系统体验”,如小部件、实时活动、控制中心和快捷指令,将能够快速显示当前记录的咖啡因总量的跟踪器,而无需用户打开跟踪应用程序。
系统搜索也是吸引一些开发者的另一大亮点。App Intent将允许应用程序在Spotlight(苹果的系统搜索功能)中展示特定的电子邮件或其他更详细的数据。
开发人员表示,应用意图编写不需要很长时间,通常只需要几行代码。
此前,Apple建议开发人员为其最重要的功能采用App Intent,Focused Work的开发者Michael Tigas说道,这是一款生产效率应用程序。
现在,如果有办法调整你的应用程序来执行任何通用操作,那么你应该为它创建一个应用意图,Tigas 说道。
幸运的是,开发人员仍有时间编写所有必要的代码来实现App Intent。虽然Apple Intelligence将于下个月开始推出,但对Siri的最重大改进计划于明年发布。
苹果的新Siri系统即使用户在说话时犯了错误,也能更好地理解问题,这是苹果与语言模型合作的直接结果,这些语言模型类似于驱动OpenAI的ChatGPT等系统的大型语言模型。
这意味着Siri将能够更灵活地理解用户可能使用的数百种不同的说法,例如“将照片滤镜应用于我昨天拍的照片。”
苹果公司必须训练和测试其模型,以理解任何给定类别应用中最有可能的命令和问题的范围。
苹果这种方法的一个缺点是,最初新的Siri只会支持少数几类应用,从照片和电子邮件应用开始。该公司表示,最终Siri将支持以书籍、日记、白板、文件管理、文字处理、浏览器、相机和照片等为重点的应用。
开发人员已经开始想象他们如何可能规划用户通过语音与他们的应用程序交互。
Superhuman,一款高级电子邮件应用程序的代表告诉CNBC,它计划使用苹果的AI系统来启用关于邮件内容的问题,例如“嘿 Siri,我的航班什么时候起飞?”或“嘿 Siri,我什么时候与詹姆斯会面以审查他的提案?”
有些开发者担心苹果的计划有一个缺点,他们担忧用户会在应用内花费更少的时间,或者会将苹果智能误认为是自己开发的人工智能功能。
“如果这个故事仅仅关于App Intents,开发者会担心他们的产品可能会被降低到只为Siri提供支持的管道软件的角色,而且不清楚如何围绕它建立可持续的业务,”电子邮件应用Spark的制造商Readdle的首席执行官 Igor Zhadanov 在一封邮件中写道。
另一个缺点是,苹果智能功能仅在最新款的iPhone上可用,而这只占整个iPhone用户群体的一小部分。这个有限的用户市场可能会让开发者缺乏短期内投入时间和精力来支持该技术的动力。
Tigas 表示:“苹果公司将这些类型的 Apple Intelligence 功能限制在新的 2024 年款 iPhone 和去年的高端机型上,因此你无论如何也无法为大众开发此类功能。”