不仅是Google最新的Pixel硬件的展示,而且是许多新AI功能的启动板。我通常对当前的AI表示怀疑,但是当我在各种演示会议上查看新软件时,我发现自己越来越感兴趣。似乎Google与Apple和Samsung一起一直在努力使这些AI驱动的更新更有帮助,从而实际上可以使我们的生活更轻松或更有趣。
没有足够的时间写上每一本书,所以我在这个故事中放了一些我的最爱Pixel 10系列本月晚些时候命中零售货架。剧透警报:其中许多与声音和通话有关 - Google历史上擅长的领域。
我长期以来一直迷恋Google的录音机应用程序。它始于在设备上的转录,从而使我的访谈从我的采访中获得引号,并相对安全。但是什么时候苹果向其语音备忘录应用程序引入了多轨记录功能,我很快跳了船。尽管iOS录音机在准确性和可读性方面具有劣等的转录,但我基本上可以与我自己录制二重奏这一事实对我的音乐剧院极客的吸引力。我同时玩过Elphaba和Glinda,将它们的零件从“好处”弯曲到我的iPhone中。
但是,当Google的Pixel软件产品管理高级总监Shenaz Zack告诉我Pixel 10的录音机应用程序会在您的唱歌中添加AI生成的音乐时,我轻轻地毫不怀疑。我在YouTube视频中花了很多时间,在各种下载平台上,我的大部分时间都从YouTube视频中撕开了卡拉OK曲目。我和我的朋友们表现出色,希望混合我们自己的流行歌曲封面,并且可以在我们的语音曲目中产生支持音乐的工具将是一个梦想成真。老实说,这仍然是。
扎克(ZackKPOP恶魔猎人配乐。最后,我自觉地咯咯地笑着,然后Zack命中停止。正如录制的那样,该应用程序实际上显示了一个标签,表明它知道我在唱歌,当我们选择录音后,出现了一个芯片,说创作和添加音乐。
挖掘出一个标题为“选择一个氛围来创建音乐的氛围”的小组,其中有两个部分:特色氛围和您的氛围。在第一个选择下,选择是“寒意,”,'一个 该应用在底部显示警告,说“如果录音很短,节拍可能不太匹配。”
我选择了舞蹈派对,下一步,在录音机上班时等了一分钟左右。顶部的动画说,系统正在分析音频,识别节奏,锁定节拍并在交付结果之前协调轨道。
我不太了解我的期望,但是我可以说,那些关心数字权利管理的人无需担心。Google为Golden生成的音乐听起来不像原始音乐,虽然它确实使我的声音听起来不那么孤独,并且使我的声音变得更加完整,但我觉得我需要再进行一些调整以使其感到满意。至于玛丽有一点羔羊,结果是AI生成的配乐对一个非常基本的托儿所押韵的预期。
值得注意的是,出现的内容似乎是正确的钥匙和节奏,我当然需要更多的时间与此一起玩,以查看调整设置是否会有所帮助。我还想指出,随着我的歌声停止,发电的音乐也停止了,所以我之前提到的咯咯笑声没有得到评分。
尽管此功能并没有符合我(公认的)幻想,但我确实认为这是对AI的有趣使用,而且似乎无害。尽管Zack确实说很大一部分人实际上使用录音机来唱歌,但这并不是大多数人日常活动的中流tay柱。此更新肯定可以带来一点点音乐创造力。
我对语音翻译功能有更多的担忧,应该使您或您的呼叫者听起来像您用另一种语言说话。根据Google的说法,目标是在电话中打破语言障碍。
Zack解释说,她的父母住在印度,尽管他们说英语,但他们的流利程度不佳。当他们叫扎克的孩子时,这造成了一些困难。只需添加一个机器人的声音,在祖父母和孩子之间翻译的声音也不对。最初,我对用翻译版本完全代替呼叫者的原始声音会有所帮助,但是经过几次演示,我肯定会摇摆。
需要明确的是,接听电话的人必须从像素手机的语音中转换为工作。从呼叫辅助子菜单中选择语音后,您必须选择一种语言。连接呼叫时,系统将对双方对呼叫表示,每个扬声器声音中的Google AI翻译。音频没有保存。
我尝试了几次与Google代表说德语的代表,我们将被称为Tim叔叔,以使我更容易地描述这个演示。每次他讲话时,我都能听到他用德语的几秒钟的声音,然后在发出铃声,而原始语言中的版本变得更柔和。听起来像是一个被称为演员蒂姆叔叔的演员来了,用英语进行了交谈,并带有对音高,节奏和表情的现实复制。
当我谈到电话时,我也可以听到反馈,所以我听到自己在另一端说德语。这确实很奇怪,因为它听起来像我。我最亲密的朋友之一住在德国,不得不忍受我学习德语超过10年的尝试。我立即想尝试翻译她的声音,看看她是否会相信我突然变得流利了(但是,当然,我必须弄清楚如何让她忽略Google AI正在工作的警告)。
老实说,经验并不完美。这些翻译不仅有时会消失(蒂姆叔叔用英语说的话没有意义),而且产生的声音似乎不像呼叫者的完整复制,而更像是新手配音的艺术家。这并不是一件坏事,因为我非常担心模仿是一个问题。
为此,扎克说,谷歌是故意实施的。她让我想起了那是鸭子,这是原始演讲在头几秒钟内仍然可以听到的,然后整个过程柔和。就像原始的音频在配音的声音下方躲开吗?我记得,尽管AI的声音听起来有点像我,但这并不是简单地构成我说的话,这只是在翻译内容。例如,我是一个决定是否要离开并诅咒一个亲戚并用母语传达的亲戚。
当然,可能仍然有错误和怪癖可以解决。讲英语的蒂姆叔叔的各种口音让我感到很开心。起初,他听起来是美国人,但是在随后的对话中,他进行了澳大利亚口音。
根据Zack的说法,所有这些都是由Pixel 10的张量G5芯片提供动力,并使用新的编解码器和语义理解进行了处理,以了解说话者的声音表达式。目前,我看到Google的目标,迫不及待地想在法兰克福打电话给我的朋友。
在发布会上,语音翻译将支持翻译或从英语中使用西班牙,德语,日语,法语,印地语,意大利语,葡萄牙语,瑞典语,俄罗斯和印度尼西亚人。
Google/Engadget的Google/屏幕截图
录音机应用程序,翻译和表达的AI是Google早已证明了专业知识的领域。使用Pixel 10的魔术提示功能,Google基本上将此功能带入您的文本和呼叫。
魔术提示可以在消息应用程序中显示快捷方式,以帮助您回答有关预订的问题或从最近的旅行中发送照片,但我最属于一个特定方面。例如,当您致电航空公司对航班进行更改时,Pixel 10可以拉出您的预订信息并在呼叫中显示,因此您不必打开电子邮件,并搜索预订确认以准备您的参考号。当然,它可能只节省了几秒钟,但是这要容易得多,Google已经在收件箱中对此进行了版本。
我很想看到此特定功能扩展并涵盖其他类型的约会,以便您可以在打电话(例如您的水管工,医生,保险提供商等)中快速获取代码或其他识别信息。
Google继续改善它的领域,摄影仍然是像素手机的优势。该公司是最早使用其算法实力的主要参与者之一,可以显着提高低光照片的质量,而Pixel 10 Pro再次使用计算处理来提供出色的图像。
新手机的专业缩放确实设法制作了一些令人惊讶的清洁遥远建筑图片,至少在我在Google的曼哈顿办事处的演示中。我们对摩天大楼的底面上的线条有多清晰给我留下了深刻的印象。Google还谨慎地澄清了Pro Zoom不会对人进行工作,并且遥远的文字看起来很奇怪。
“我们已经调整了Pro Res Zoom来最大程度地减少幻觉,但是它们可能仍会发生 - 尤其是在遥远的文本中。此外,当Pro res Zoom检测到现场的人时,我们使用了一种防止不准确表示的增强算法,”根据Google的说法。
在这种情况下,算法将下降到超级缩放质量。根据您使用哪种像素手机,Super Res Zoom最多可提供20倍或30倍的变焦。
在我看到的结果中,与建筑物的外墙相比,站在塔顶上的甲板上的人们似乎有些像素化,而且效果不会令人震惊,甚至真的很明显,直到我放大。但这可能是因为它们是一个很小的一部分,我想如果一个人是一个场景中的人,我想像一个人看起来有所不同。
作为喜欢构图图片的人,我不认为相机教练的功能会为我做任何事情。但是我很惊讶我实际上喜欢AI拟议的一些框架选项。我仍然认为我不会在现实世界中使用它,但是它可能会帮助其他想要摄影技巧的人。
最初,我对新照片功能感到不满,该功能让您告诉您如何编辑图片,但是经过简短的演示,我来了。简单地告诉双子座变成红色的连衣裙或摆脱后台的人,不仅更容易,而且有效。我还想指出,Google还对其相机应用程序的指导框架功能进行了调整,该功能可以帮助那些盲人或视力障碍的人知道现场的内容。现在,它使用双子座模型,这应该有助于对象识别。
最后,值得召集支持C2PA内容真实性计划。Google正在将其构建到照片应用程序中,其中元数据将显示图片中是否使用了AI。这像素10手机将是第一个实施的手机新的行业标准内容凭据(CR)以及Adobe,Amazon,Google,Meta,Microsoft,OpenAI等公司都是该计划的一部分。
这些只是我最近在Google Event之前的演示中给我留下深刻印象的新型AI相关功能的一部分。但是,我发现了更多有希望的东西,例如Gemini Live中的Visual Overlays和新的Pixel Journal应用程序。我没有花那么多时间,但是他们在我的简短演示中工作。``采用一条消息功能''将向您发送语音邮件的抄本,这似乎是一种警报,这似乎是一种比电话应用程序的隐藏部分更好的方法。
我还没有在每日枢纽上出售,这基本上是现有页面的更新版本,该版本位于主页的左侧,显示了您可能想探索的相关操作和文章。在寻找要消费的东西时,我是有意的,并且拥有我更喜欢毁灭性企业的特定应用程序(对所有内容的reddit),所以我不确定每日枢纽是否适合我。
尽管如此,我喜欢Pixel 10系列的大部分新AI功能的事实还是很重要的。当然,我仍然会保留判断力,直到我可以在现实世界中花更多的时间与他们在一起,并希望对其中一些进行评论。但是,从我与Pixel 10演示的时间相距甚远,Google对它如何与AI融为一体有关,我希望它的竞争对手会记笔记。