OC

Knowledge OS
鹦鹉螺口语
我尝试过 Gemini Omni,但我还没有准备好接受它的未来感
2026-06-13 10:00:11 · 英文原文

我尝试过 Gemini Omni,但我还没有准备好接受它的未来感

作者:Parth Shah

Parth 是一位技术分析师和作家,专门从事 Android 生态系统的全面回顾和功能探索。他的工作重点是生产力应用程序和旗舰设备,特别是 Google Pixel 和三星移动硬件和软件。

他提供有关生产力软件、系统优化和高级功能的专家指导,使用户能够最大限度地发挥设备的潜力。他的分析对于寻求掌握复杂操作系统功能并简化数字工作流程的读者来说是至关重要的资源。

当他不忙于技术分析和软件评估时,帕斯会花时间观看韩剧、研究移动技术趋势和人工智能的作用。

每家科技巨头都声称自己已经打造出了下一件大事。

所以,当我启动时双子座Omni,我期待通常的渐进式抛光。我对实际发生的事情完全没有准备。

我带着怀疑的心情进去了,出来的时候我彻底震惊了。

事实证明,我还没有准备好接受这个生态系统在实践中的流动性、深度集成和彻头彻尾的未来感。

A woman sitting on a couch using her phone, surrounded by Gmail, Drive, Docs, YouTube, and Gemini logos.

除了聊天之外,我使用 Gemini 的 7 种意想不到的方式

它成为我的 Android 工作流程的重要组成部分

Gemini Omni 到底是什么?

Gemini Omni

如果您一直在追踪最新的 AI 滴,您可能听说过很多关于 Google Omni 的传闻。但当你去掉营销的花哨之后,实际上是什么?

从本质上讲,Gemini Omni 是专为下一代视频创作和编辑而设计的创意合作伙伴。

它不仅仅是另一个标准的聊天机器人,您可以在其中输入文本提示并祈祷视频输出看起来还不错。

它是直接内置于 Gemini 生态系统中的多模式,供付费用户使用。

Omni 不是仅仅猜测下一帧应该是什么样子,而是将 Google 的生成媒体模型与对物理、照明和文化的实际理解相结合。

我可以一次向其提供文本、多张照片和一个视频剪辑,以构建高质量的视频输出。

对话式视频编辑是其杀手锏。

由于 Omni 能够理解它所看到的内容和它所创建的内容,因此您只需与它交谈即可编辑任何视频。

这基本上就像在你的侧边栏中有一位熟练的视觉特效编辑和导演一样。

一系列模板可供选择

use template to create video in Gemini Omni

当您第一次跳到专用的“视频”选项卡时,您不会只是盯着一个空白的、闪烁的提示框,想知道如何定义电影杰作。

谷歌为新用户提供了一项贴心的功能:现成的模板库。

对我来说,这是一个巨大的胜利,因为并不是每个人都能熟练地制作复杂的人工智能提示,他们也不想花 20 分钟调整描述性形容词只是为了得到一个简单的生日邀请视频。

您可以滚动浏览各种风格化模板,包括视频游戏、漫画书、动漫、会说话的宠物、模因和其他风格。

选择模板后,您可以替换一些基本的占位符详细信息。如果您要制作邀请函或庆祝剪辑,请输入生日人的姓名、时间、地点或特定主题。

您按下 Enter 键,Omni 就会处理繁重的工作并立即生成高质量的视频。

视频 Vibe 编码

create a video in Gemini Omni

为了测试它的极限,我向它提供了一个关于智能手机摄像头传感器如何捕获光线的非常具体、复杂的提示。

大多数模型都会给我一个普通的、看起来很科技的剪辑。然而,Omni 确定了物理细节——光线照射光圈的方式、默认的视场移动以及机械运动的精确度令人惊讶。

给我印象最深的不仅仅是最初的输出,而是我可以说的事实:“实际上,将光圈调大一点,并给它一个冷色调的电影灯光,”它立即调整了整个场景。

但真正令人惊叹的时刻是当我将自己放入画面中时。

我上传了一张我坐在车里的普通照片,并给了它一套非常疯狂的指令:“让这张照片栩栩如生,让这个人唱一首宝莱坞歌曲,让他的头发真实地飘扬起来,就像有微风一样。”

create a video from an image in Gemini Omni

它做得非常好。它捕捉了歌唱的动作,添加了树木、交通和其他细节的平滑动作。

这就是对话式编辑真正发挥作用的地方。

我无需重新上传照片或重新开始。我刚刚和它聊天:“好吧,那太好了,但是请把歌曲改成这个曲调,让我的脸看起来瘦一点。”

几秒钟后,事情就完成了。它将口型同步上传到新轨道并调整我的面部结构,而不会破坏场景的连续性。

Connect WhatsApp with Gemini

使用 Omni 获取教育内容

educational video in Gemini Omni

Omni 拥有强大的教育和教学能力。

想象一下,作为一名教师或内容创作者,需要解释复杂的物理和历史时间线。

通常,您需要像 After Effects 这样昂贵的软件和陡峭的学习曲线来完成这种排版。

借助 Gemini Omni,您可以简单地描述您想要的体验。

为了测试它的精确度,我向 Omni 抛出了一个复杂的、多层的提示,我预计它会遇到困难,但它在第一次尝试时就完美地确定了视觉风格。

让我震惊的不仅仅是产量,还有生成速度。

它不仅了解创意方向,还了解创意方向。它在几秒钟内同步了动画和音轨,证明了 Omni 是专业级教育内容的强大力量。

这不是另一个华丽的演示

完成技术评论并感受到真正的敬畏感是很少见的,但这正是 Gemini Omni 留给您的。

如果你正在等待人工智能不再让人觉得新鲜的那一刻开始感到兴奋,就是这样。

人工智能的未来不再只是一些路线图;而是。它就在这里,它是流动的,坦率地说,其他一切现在都感觉像是过去了。

Gemini 体验不仅限于 Omni 附加组件。这里还有其他的充分利用 Google 人工智能的提示和技巧

关于《我尝试过 Gemini Omni,但我还没有准备好接受它的未来感》的评论

暂无评论

发表评论

摘要

技术分析师 Parth 评论了 Gemini Omni,这是 Google 推出的一款先进视频创建和编辑工具,因其流畅性和未来功能而脱颖而出。与预期相反,Gemini Omni 提供了一个超越典型聊天机器人的深度集成生态系统,它使用生成模型根据文本、照片和视频剪辑创建高质量视频。主要功能包括对话式视频编辑和易于使用的预制模板。帕斯强调了该系统理解物理细节并无缝适应用户指令的能力,标志着人工智能技术的重大进步。

相关讨论