科技行业一直在竞相将生成式人工智能交到消费者手中,但这只是“其潜力的一个尝试”,一位人工智能高管表示。
Sissie Hsiao,Google 副总裁兼 Gemini 应用和演讲总经理 (谷歌)告诉 Quartz,她相信公司明年将“以人们从未想到过的方式提供帮助”。
虽然“人工智能助手”目前与用户一起工作,需要反复提示,但消费者将开始看到它们“超越简单的便利,转变为您每天依赖的真实、个性化、先进的体验。”
Hsiao 举例说,人们正在使用 Google 的 Gemini AI 来执行更高级的任务,例如使用 Gemini Live 练习面试以及使用 Gemini Advanced 调试代码。
11 月,谷歌为 Gemini 推出了一款 iPhone 应用程序,其中包括新的 Gemini Live 语音助手功能,该功能可以处理带有干扰和话题变化的自然对话。到目前为止,Gemini Live 提供 10 种不同的语音选项,支持 12 种语言,包括西班牙语和阿拉伯语。谷歌表示计划推出更多语言。
Hsiao 表示,到 2025 年,人工智能的“下一个前沿”是“代理能力”。人工智能代理是可以自主完成复杂任务的软件。
具体来说,Gemini“将进行深度个性化,记住您之前告诉过它的内容,并按照您的指示”,能够在 Google、第三方服务和网络上代表您采取行动,“萧说道。
谷歌最近在 Gemini Advanced 中推出了一项名为“深度研究”的新功能,该功能使用人工智能探索复杂的主题,并将发现转化为用户易于阅读的报告。Hsiao 称 Deep Research 是 Gemini 的第一个功能,它将我们在产品中构建更多代理能力的愿景变为现实。
萧表示,明年的人工智能市场将是“继续构建完整的生态系统”,并补充说她对这一市场的看法与智能手机市场类似。
“这不再仅仅与硬件有关,而是围绕它的应用程序、服务和集成的整个生态系统,”Hsiao 说。“与人工智能类似,我们如何更好地构建最全面、最用户友好的生态系统至关重要。”
Hsiao 表示,谷歌致力于在 2025 年将 Gemini 打造成“最有用的个人人工智能助手”,并补充说,实现这一目标的关键是将人工智能融入用户的日常生活,并使日常工作无缝集成。
今年早些时候,谷歌推出了 Gemini Live,这是一种移动对话体验,允许用户与聊天机器人进行自由流畅的对话。
“在集思广益新想法或排练重要对话时能够与双子座交谈已经改变了游戏规则,”萧说。“展望未来,我们将更加关注使与 AI 交互变得更加简单、易于访问和实用的功能。”
到 2025 年,专注于人工智能的科技公司将继续开发多模式人工智能,或者可以处理文本以外的不同类型数据(例如语音、图像和视频)的模型。
例如,在谷歌 6 月份的年度 I/O 开发者大会上,该公司推出了 Project Astra,该项目旨在展望多模式人工智能助手的未来。
“自 2016 年以来,我们一直说谷歌是一家人工智能优先的公司,这一点不会改变,”萧说。– 人工智能是必备的,正如我们看到的那样,它正在融入公司运营的各个方面,从产品开发、客户服务到营销和销售 – 拥抱这一点至关重要技术以保持竞争力。”