英语轻松读发新版了,欢迎下载、更新

VLC 正在开发人工智能驱动的实时字幕

2025-01-12 19:16:20 英文原文

作者:Joey Sneddon

VLC(非常流行的开源媒体播放器)正在开发实时人工智能字幕功能。

负责 VLC 开发的非营利组织 VideoLAN 在 CES 2025 期间演示了 VLC 中的自动字幕生成 - 其中不是使用 AI 让您在今年脱颖而出 — 并且分享了一个剪辑上周在 X 的 CES 展台上展示了​​该功能的实际应用。

VLC 无需云服务或互联网连接即可使用 AI 自动生成字幕。

该功能离线工作,为超过100+语言提供实时翻译支持;能够同时翻译/显示两种语言;并且可以将翻译“保存”到 SRT 文件。

– VLC 自动字幕生成和翻译基于本地和开源 AI 模型,在您的机器上运行,离线工作,并支持多种语言, –VideoLAN 在其 X 帖子中说道。

后续帖子中分享的照片显示了英国喜剧演员 Ricky Gervais 的视频(标志性/臭名昭著,取决于您的敏感度)2020 年金球奖烘焙以各种不同语言显示实时字幕,包括日语和法语:

VLC 的实时人工智能字幕正在运行(图片:VLC,编辑:我)

我们大多数人都熟悉 YouTube 上自动生成的字幕,社交媒体“创作者”使用 AI 字幕应用程序在短视频上“刻录”字幕,许多领先的视频编辑器都有插件和/或原生真实字幕- 时间转录功能也有。

在 VLC 中利用类似技术是有意义的。

我喜欢观看带字幕的本地电影、电视节目和 DVD,但有时文件/光盘上没有字幕。VLC 有一个内置的字幕下载工具,无需在大量恶意软件兜售的免费字幕下载网站中寻找 SRT 文件。

当然,只有某人在某处以您需要的语言共享/制作了字幕文件,您才能下载字幕文件。如果他们没有——或者你想要自定义视频(或其他类型的内容)上的字幕——不做评判,但他们真的有很多话要说吗?1),你就得靠你自己了。

我想知道 VLC 的自动字幕功能是否利用了 OpenAI 耳语,因为它是用于语音识别任务的领先开源神经网络。

无论 VLC 使用何种模型,它都可以离线运行、与云分离,无需登录、注册或网络连接,这很好。

一位关注者询问他们是否会考虑使用云服务而不是 VideoLAN回复可以说“绝对不”,因为“目标是不依赖昂贵的云运营!”

截至撰写本文时,VLC 尚未(据我所知)表明何时/是否会提供具有 AI 生成字幕的播放器的公开演示以供测试,但表明这个功能可能作为 VLC 4.0 的一部分提供。

目前,如果您想观看的 MP4 电影缺少字幕,您需要坚持寻找 SRT/VTT 文件。

想象这一功能用于一般实时非官方人工智能配音并不是一个飞跃——尽管人工智能无法发挥作用,而且这一举措可能会得到更广泛的行业实施,导致流媒体服务用人工智能取代配音演员。

  1. 显然,我说的是音乐会。❗️❗️❗️

关于《VLC 正在开发人工智能驱动的实时字幕》的评论


暂无评论

发表评论

摘要

VLC 媒体播放器正在开发离线实时人工智能字幕功能,无需互联网或云服务即可工作。该功能在 CES 2025 上进行了演示,支持 100 多种语言,可以同时显示两种语言,将翻译保存到本地 SRT 文件。它利用本地 AI 模型执行语音识别任务,例如 OpenAI 的 Whisper,并提供实时翻译功能。VideoLAN 强调此功能不依赖昂贵的云操作。确切的发布日期尚未指定,但可能会包含在 VLC 4.0 中。