2025 年是 PC 上人工智能发展的突破年。
PC 级小语言模型 (SLM) 的准确性比 2024 年提高了近 2 倍,大大缩小了与前沿基于云的大语言模型 (LLM) 的差距。Ollama、ComfyUI、llama.cpp、Unsloth等AI PC开发者工具已经成熟,其受欢迎程度逐年翻倍,下载PC级模型的用户数量较2024年增长了十倍。
这些进展为生成式人工智能今年在日常电脑创作者、游戏玩家和生产力用户中广泛采用铺平了道路。
在本周的 CES 上,NVIDIA 宣布推出针对 GeForce RTX、NVIDIA RTX PRO 和 NVIDIA DGX Spark 设备的一系列 AI 升级,以释放开发人员在 PC 上部署生成式 AI 所需的性能和内存,其中包括:
- 通过 PyTorch-CUDA 优化和本机 NVFP4/FP8 精度支持,视频和图像生成 AI 的性能提升高达 3 倍,VRAM 减少 60%舒适用户界面。
- RTX 视频超分辨率集成在 ComfyUI 中,加速 4K 视频生成。
- 针对 Lightricks 最先进的开放权重版本的 NVIDIA NVFP8 优化LTX-2音视频生成模型。
- 新的视频生成管道,用于使用 Blender 中的 3D 场景生成 4K AI 视频,以精确控制输出。
- 通过 Ollama 和 llama.cpp,SLM 的推理性能提高了 35%。
- RTX 加速Nexa.ai— 超链接新的视频搜索功能。
这些进步将使用户能够无缝运行高级视频、图像和语言人工智能工作流程,并具有本地 RTX AI PC 提供的隐私、安全性和低延迟功能。
在 RTX PC 上以 3 倍的速度生成 4K 视频
生成式人工智能可以制作令人惊叹的视频,但仅靠提示很难控制在线工具。尝试生成 4K 视频几乎是不可能的,因为大多数模型太大,无法安装在 PC VRAM 上。
今天,NVIDIA 推出了一种由 RTX 驱动的视频生成管道,使艺术家能够准确控制自己的生成过程,同时生成视频的速度提高了 3 倍,并将其升级到 4K - 仅使用一小部分 VRAM。
该视频管道允许新兴艺术家创建故事板,将其转换为逼真的关键帧,然后将这些关键帧转换为高质量的 4K 视频。该管道分为三个蓝图,艺术家可以根据自己的需求进行混合、匹配或修改:
- 为场景创建资源的 3D 对象生成器。
- 3D 引导图像生成器,允许用户在 Blender 中设置场景并从中生成逼真的关键帧。
- 视频生成器可跟踪用户的开始和结束关键帧来制作视频动画,并使用 NVIDIA RTX 视频技术将其升级到 4K
通过突破性地发布新产品,该管道成为可能LTX-2型号来自 Lightricks,今天可供下载。
LTX-2 是本地 AI 视频创作的一个重要里程碑,它提供的结果可与领先的基于云的模型旗鼓相当,同时生成长达 20 秒的 4K 视频,具有令人印象深刻的视觉保真度。该模型具有内置音频、多关键帧支持和先进的调节功能,并通过可控性低阶适应增强 - 为创作者提供电影级的质量和控制,而无需依赖云。
在幕后,该管道由 ComfyUI 提供支持。过去几个月,NVIDIA 与 ComfyUI 密切合作,将 NVIDIA GPU 的性能优化了 40%,最新更新增加了对 NVFP4 和 NVFP8 数据格式的支持。总而言之,采用 RTX 50 系列 NVFP4 格式时,性能提高了 3 倍,VRAM 减少了 60%;采用 NVFP8 格式时,性能提高了 2 倍,VRAM 减少了 40%。

NVFP4 和 NVFP8 检查点现在可直接在 ComfyUI 中用于某些顶级模型。这些模型包括LTX-2来自莱特里克斯,通量.1 和通量.2来自 Black Forest Labs 的 Qwen-Image 和 Z-Image 来自阿里巴巴。直接在 ComfyUI 中下载它们,其他模型支持即将推出。

生成视频剪辑后,使用 ComfyUI 中的新 RTX 视频节点,视频只需几秒钟即可升级到 4K。该升级器实时工作,锐化边缘并清除压缩伪影,以获得清晰的最终图像。RTX Video 将于下个月在 ComfyUI 中提供。
为了帮助用户突破 GPU 内存的限制,NVIDIA 与 ComfyUI 合作改进了其内存卸载功能(称为权重流)。启用权重流后,ComfyUI 在 VRAM 耗尽时可以使用系统 RAM,从而在中档 RTX GPU 上启用更大的模型和更复杂的多级节点图。
视频生成工作流程将于下个月提供下载,新发布的 LTX-2 视频模型的开放权重和 ComfyUI RTX 更新现已提供。
搜索 PC 文件和视频的新方法
几十年来,PC 上的文件搜索一直是一样的。它仍然主要依赖于文件名和不稳定的元数据,这使得追踪去年的一份文档比应有的困难得多。
超链接Nexa.ai 的本地搜索代理将 RTX PC 转变为可搜索的知识库,可以通过内联引用以自然语言回答问题。它可以扫描文档、幻灯片、PDF 和图像并为其建立索引,因此可以通过想法和内容来驱动搜索,而不是猜测文件名。所有数据均在本地处理并保留在用户的 PC 上,以确保隐私和安全。此外,它还支持 RTX 加速,在 RTX 5090 GPU 上每 GB 索引文本和图像文件需要 30 秒,响应时间为 3 秒,而在 CPU 上索引文件每 GB 需要 1 小时,响应时间为 90 秒。
在国际消费电子展上,Nexa.ai即将推出新的超链接测试版,该版本增加了对视频内容的支持,使用户能够在视频中搜索对象、动作和语音。对于从寻找 B-roll 的视频艺术家到想要找到自己赢得大逃杀比赛并与朋友分享的游戏玩家的用户来说,这是理想的选择。
对于那些有兴趣尝试超链接私人测试版的人,请注册访问这个网页。Access 将从本月开始推出。
小语言模型速度提高 35%

NVIDIA 与开源社区合作,使用 Llama.cpp 和 Ollama,为 RTX GPU 和 NVIDIA DGX Spark 桌面超级计算机上的 SLM 带来了重大性能提升。最新的变化对于专家混合模型特别有利,包括新的NVIDIA Nemotron 3 系列开放型号。
在过去四个月中,llama.cpp 和 Ollama 的 SLM 推理性能分别提高了 35% 和 30%。这些更新现已推出,llama.cpp 的生活质量升级也加快了 LLM 的加载时间。
这些加速将在 LM Studio 的下一次更新中提供,并且很快就会出现在新的 MSI AI Robot 应用程序等代理应用程序中。MSI AI Robot 应用程序也利用了 Llama.cpp 优化,让用户可以控制其 MSI 设备设置,并将在即将发布的版本中纳入最新更新。
NVIDIA Broadcast 2.1 为更多 PC 用户带来虚拟主光

NVIDIA Broadcast 应用程序通过 AI 效果提高用户 PC 麦克风和网络摄像头的质量,非常适合直播和视频会议。
2.1 版更新了虚拟键光效果以提高性能,使其可用于 RTX 3060 桌面 GPU 及更高版本,处理更多照明条件,提供更广泛的色温控制,并使用更新的 HDRi 底图来实现专业流中常见的双键光风格。下载NVIDIA 广播今天更新。
借助 DGX Spark 将家庭创意工作室转变为 AI 引擎
随着新的、功能日益强大的人工智能模型每月登陆 PC,开发人员对更强大、更灵活的本地人工智能设置的兴趣持续增长。DGX 火花– 紧凑型 AI 超级计算机,适合用户办公桌并与主台式机或笔记本电脑无缝配对 – 可以与现有 PC 一起进行实验、原型设计和运行高级 AI 工作负载。
Spark 非常适合那些有兴趣测试法学硕士或原型代理工作流程的人,或者想要与工作流程并行生成资产以便其主 PC 仍可用于编辑的艺术家。
在 CES 上,NVIDIA 推出了 Spark 的主要 AI 性能更新,自不到三个月前推出以来,性能提升了 2.6 倍。

新DGX Spark 手册还提供了多种工具,其中一种用于推测性解码,另一种用于使用两个 DGX Spark 模块微调模型。
插入 NVIDIA AI PC脸书,Instagram,抖音和X– 订阅并随时了解最新动态RTX AI PC 通讯。关注 NVIDIA 工作站领英和X. . .
参见通知关于软件产品信息。