我是多年的YouTube视频制作人——这三种AI工具帮助我更好地、更快地完成工作。

2024-10-18 10:00:00 英文原文

作者:Written by David Gewirtz, Senior Contributing Editor Oct. 18, 2024 at 3:00 a.m. PT

record45gettyimages-1452424169
Vladyslav Varshavskiy/盖帝图像

我总是喜欢寻找新的应用方式人工智能(AI)工具到我的日常生产力任务。去年,我展示了我是如何使用生成式AI来修复一些糟糕的音频并调整了一段简短的教学视频。我使用了Photoshop的生成填充功能, Adobe podcast以及当时新的背景替换功能在Final Cut Pro.

这次我使用了一个AI云台来帮助相机跟随我的动作,使用了苹果公司在MacOS Sequoia中的Voice Memos AI转录功能来转录音频未编写的视频,并用ChatGPT为开箱视频建议标题、标签和描述。

также: (由于"Also:"本身没有具体要翻译的内容,直接按照常见翻译习惯给出中文对应部分。如果要求更精确或者上下文环境中该词有特定含义,请提供更多信息。) 原文: Also: 如需严格按照指示,则输出: Also:如何使用Photoshop的生成填充AI工具轻松转换你的无聊照片

让我们开始这个项目吧。我会尽可能频繁地为我的YouTube频道制作视频,但我主要的工作产出是写作。所以我尽量想办法优化我有限的非写作时间,以便为各种YouTube项目服务。

我最近制作的视频是一部多丝束3D打印机的开箱过程。 The 安克ubic Kobra 3 组合版可以一次性使用多达四种颜色进行打印。拆箱视频一直很受我的观众欢迎,所以我想尽快完成这个视频。

自动相机:Hohem iSteady v3 手持云台

拆箱的挑战在于,往往很难决定拍摄什么内容,因为我直到打开箱子之前都不知道里面有什么。确保我能拍到好素材的最佳方法是把很多相机放在我的工作区域周围,然后就开始我的拆箱过程。

также:如何免费下载YouTube视频 - 两种方法

问题是,我在拆箱时经常在车间里走来走去。在之前的视频中,我经常会拍到自己不在画面中的镜头,或者频繁进出画面。过去我试过一些自动跟随的稳定器,但除非我一直直接面对着稳定器,否则它们总是会搞混。

hohem
大卫·格尔维茨/ZDNET

这一次不。

我捡起了霍蒙 iSteady v3 云台在亚马逊上售价为100美元。(它的原价是129美元。)我观看了一些关于这个稳定器的评论,开始意识到在过去的一年里,稳定器技术有了很大的进步。这款稳定器拥有一系列应用程序辅助功能,但最让我喜欢的是它有一个“AI模块”,可以自动调整稳定器的方向,无论你是否在运行应用程序,甚至你使用何种相机。

也:我制作高质量YouTube视频的9个必备小工具

即使您没有安装应用程序,云台也能响应几个简单的手势。我还没有安装应用,但我已经制作了一段很棒的视频,视频中我的动作追踪非常出色。

设置非常简单。通过USB-C充电,然后拉出内置的三脚架腿并插入你的相机。我用我的旧iPhone SE夹在小夹具里。长按电源键即可开机。它会自动校准,将手机设置为竖拍模式。

要切换到横屏模式,你只需将两个拇指指向左边。然后,做出一个OK的手势,它就会在你走动时跟踪你。

также: (由于"Also:"本身没有具体含义或内容供翻译,在这种情况下直接给出原文更为恰当。如果此处意为“此外”或者“还有”,请根据上下文明确其意思。) 按照指示,只输出翻译结果且此短语无实际需要翻译的内容,则输出: Also: NASA遇到了一个问题,并且如果你们有解决方案,他们愿意提供高达300万美元的奖励。

这个稳定器开箱即用,完全解决了我的画面外问题,因为AI模块内的内置机器学习功能能够完美地追踪我。当我移动到工作台后面以及我在拆箱的大箱子后面时,它都能准确追踪我。当我在朝向相机走动、转身或离开时,它也能持续追踪我。唯一一次失联的情况是在我完全走出房间的时候,而要重新吸引它的注意力,我只需要举起手做出“OK”的手势即可。

除了云台上的手机,我还使用了一部iPhone从高处向下拍摄。我还用了两台iPad,它们的前置摄像头在拍摄时让我能够实时查看画面内容。是的,前置摄像头的分辨率略低一些,但为了始终拥有一个内置监视器,这个取舍是值得的。

2. 语音转文字:MacOS 声音备忘录

这段视频完全是即兴创作的,所以我没有预先写好的剧本可以输入到YouTube以生成字幕。我也无法将剧本提供给ChatGPT来帮助我进行SEO和标签建议。

相反,我只是将我的评论录进了录音中大疆麦克风2这台设备是通过蓝牙连接到我的一个iPad上的。在所有四个iOS设备上录制完成后,我将视频导入Final Cut Pro,并使用多机位功能来匹配四个摄像头角度的时间同步。这样,在编辑过程中,我可以轻松地通过输入1、2、3或4在不同的镜头之间切换,这对应于我在影片中想要显示的任何一个摄像头的镜头。

也请注意:我一直是 Final Cut Pro 的忠实用户,直到 DaVinci Resolve 凭借这三个功能赢得了我的心。

要获取适合转录的音频文件,你只需要打开Final Cut生成的已完成视频文件,并在QuickTime Player中打开它。在文件菜单中,选择导出为>音频。你没有格式选择选项,所以你只能使用m4a格式。幸运的是,这对于我们的情况是可行的。

接下来,在Sequoia中打开语音备忘录应用。这在较早版本的MacOS上无法使用。语音备忘录没有导入选项,但如果你将m4a音频文件拖放到录音列表中,你会看到一个短暂出现的绿色加号,并且该文件会被添加到剪辑列表中。请注意,语音备忘录会根据你的录音时间而非你插入的时间来对剪辑进行排序。

导入后,点击非常小的灰色转录图标。

import-memo
截图由David Gewirtz/ZDNET提供

稍等一会儿它就会生成文字记录。

transcript
David Gewirtz/ZDNET截图

让我们说清楚。这是一个糟糕的转录。它把我的名字写错了,产品名称也错了,并且没有任何段落或换行的概念。它似乎没有使用任何从我在这台Mac上输入的数百万单词中提取的自定义设备词典。

这与商业上会产生的东西完全不同Rev.com这项服务是可用的,但人工转录每分钟收费两美元,这段小视频的转录费用将超过20美元。使用这个Apple语音备忘录技巧是免费的(尽管你得到的是你所支付的价格对应的品质)。我并不贬低Rev.com。当质量对客户工作很重要的时候,我会使用他们的服务。

также: (注:这里的“也即”可能不完全符合英文"Also:"的意思,在没有具体上下文的情况下,建议保留为“Also:”,如果希望更自然的中文表达可以写作“此外:”。) 原文: Also: 根据指示只输出翻译结果: Also:我通过更改这些11个设置提高了iPhone的电池寿命

但对我来说打开那个小盒子根本不值得花费那么多。

要从语音备忘录中提取文本,点击编辑按钮并复制。你需要将其粘贴到你选择的文本编辑器中并保存以便日后使用。花一点时间进行一些修改。你还需要搜索并粘贴你的名字和产品名称,以确保转写本中的信息是正确的。

3. AI与YouTube工作室:ChatGPT

我们将在这份字幕文本在YouTube Studio中做几件事。首先,当你上传视频后,进入YouTube Studio并点击字幕选项卡。如果你的视频已经在系统中有一段时间了,YouTube很可能会自动生成自动字幕,就像我视频中的那样。

subtitles
截图由David Gewirtz/ZDNET提供

但在自动字幕条目上方,通常有一系列三个点的选项,你可以在此输入你自己的“英语(视频语言)”字幕。我的已经完成了,但你需要点击箭头并上传之前稍作修正的文本文件。

YouTube 使用这来帮助生成字幕,将你上传的内容与它内部创建的内容进行比较。我还从其他油管博主那里听说,上传完整的字幕后可以获得更多 SEO 好处,因为 YouTube 更了解你的视频内容,据说算法会根据这些信息最大化曝光率。

also:我是ChatGPT的高级用户——这个新功能立刻让我变得更加高效

接下来是视频列表中三个易于编写的部分:标题、描述和标签。作为一名作者,这是我整个项目中最简单的一部分,但作为一名AI研究员,这也是一个机会来看看我们可以从像这样的大型语言模型获得什么。ChatGPT为我们做些什么。

我感到很高兴。AI不会直接“观看”我的视频,但ChatGPT plus已经导入了我的记录。我给了它这样的提示:

阅读以下内容,然后等待进一步指示。

然后我给它输入了这个提示:

这是一段来自YouTube视频的文字记录。请给我提供10个有影响力的可能的YouTube视频标题。

它返回了以下10个视频标题:

  • 安速倍 Kobra 3 Combo 开箱体验:轻松实现四色三维打印
  • 多股丝魔术:安库博 Kobra 3 Combo 内部揭秘
  • 首次体验安库博 Kobra 3 Combo — 四色3D打印开箱!
  • 安布克 Kobra 3 Combo 设置:开箱和组装指南
  • 安克ubic Kobra 3 Combo 开箱体验 —— 一盒多丝材力量
  • 揭秘3D打印机开箱:Kobra 3组合版
  • 终极3D打印:开箱安库博Kobra 3组合版
  • 低成本多色3D打印?安克ubic Kobra 3 Combo评测
  • 揭秘未来的3D打印:Anycubic Kobra 3 Combo
  • Anycubic Kobra 3 Combo如何改变多丝材3D打印

不知为何,ChatGPT喜欢将这些列表项中的所有单词都大写。这让我很反感,但既然我没有告诉它不要这样做,我姑且能忍受这种对我的写作敏感性的冒犯。尽管我对这段未经脚本编写、转录质量较差的视频的关注点感到相当满意,但它表现得非常好。

然而,我喜欢其中一个标题。我选择了“拆箱未来的3D打印:Anycubic Kobra 3 Combo”。然后我让它写一个YouTube描述。这通常是我要快速完成的任务,但我想看看AI的表现如何。我给了它这个提示:

我们正在使用“揭开3D打印未来序幕:安易创Kobra 3 Combo。”请给我一个优质的YouTube描述。

第一个结果非常简短,并不具备特别的说服力。所以我告诉它:

让它更长一些

和标题一样,我相当印象深刻。记得它的唯一素材就是那份原始的剧本。以下是它生成的内容:

欢迎观看我的安霸立方Kobra 3 Combo开箱视频,这是一款革命性的3D打印机,旨在提升您的多色打印项目!在这段视频中,我将引导您完成整个开箱过程,展示四色线材切换器及其包装方式。从初始设置到查看包含的组件,我将重点介绍组装的简便性,并分享我在制作此类视频时使用的摄像头设置。无论您是刚刚接触3D打印的新手还是经验丰富的制造者,这个开箱视频都将为您提供Kobra 3 Combo的深度预览。

敬请期待即将发布的视频,我将带您了解测试打印、高级设置以及打印机性能的全面评测。这款组合设备对于希望简化多色丝线打印而无需牺牲质量和使用便捷性的任何人来说都是一项变革性技术。

别忘了点赞、评论和订阅,以获取更多关于3D打印、智能家居技术以及一切高级极客内容!

最后,我让它生成了一些标签。在这里我要说,ChatGPT不能替代像商业标签分析工具这样的东西。TubeBuddy但这套节目还算可以,尽管带有我名字和我频道名称的自引用标签并没有给我们带来什么好处:

Anycubic Kobra 3,Kobra 3 Combo,3D打印,多色3D打印,3D打印机开箱,3D打印设置,3D打印机评测,多功能3D打印机,Anycubic,Kobra 3开箱,色彩线材切换器,3D打印教程,高级技术细节,3D打印技术,DIY 3D打印,Kobra 3设置,Anycubic Kobra 3评测,线材切换器,科技开箱,3D打印机组装,智能家居技术,创客技术,David Gewirtz

核心问题是什么,Dave?

总体而言,在这个项目中使用的三个AI,我会给出以下评分:

  • 霍曼iSteady v3稳定器:A
  • MacOS 语音备忘录转写:C
  • ChatGPT: 查特GPTB+

他们所有人都很好地完成了工作。你可能会发现他们都很有帮助,除非你已经不需要他们的帮助了。我还会使用稳定器——这对我的拍摄非常重要。如果我要字幕或剧本,我可能会付费获取。Rev.com如果是高杠杆项目。而且,我自己为YouTube视频编写标题和正文比说服ChatGPT我想要的东西更容易也更快。

但如果你不是像我的狗听到任何声音就会叫一样,经常把文字写在纸上的专业作者,那么类似ChatGPT这样的工具可能会非常有助于你克服创作可读的YouTube帖子支持文本的难关。

事情就是这样凑在一起的:

你是否使用人工智能来帮助你的YouTube视频?你使用了哪些AI工具?有没有试过用苹果公司的技术进行AI转录?你是如何使用ChatGPT的?在评论区告诉我们吧。


你可以在社交媒体上关注我的日常项目更新。务必订阅我的周更新通讯newsletter并在Twitter/X上关注我@戴维格威茨,在Facebook上facebook.com/DavidGewirtz,在Instagram上发布于Instagram.com/DavidGewirtz,在YouTube上观看YouTube.com/DavidGewirtzTV.

关于《我是多年的YouTube视频制作人——这三种AI工具帮助我更好地、更快地完成工作。》
暂无评论

摘要

Vladyslav Varshavskiy/Getty Images我一直喜欢寻找新的方法将人工智能(AI)工具应用于我的日常工作效率任务。转录音频:MacOS语音备忘录这个视频完全是即兴创作的,所以我没有可以输入YouTube以生成字幕的预先写好的脚本。另外:我一直是Final Cut Pro的忠实用户,直到DaVinci Resolve凭借这3个功能赢得了我的心接下来是视频列表中的三个容易编写的部分:标题、描述和标签。而且,我自己为YouTube视频撰写标题和正文比说服ChatGPT来帮我更容易也更快。