人工智能转录初创公司 Otter.ai 的首席执行官兼联合创始人 Sam Liang 有一个计划,可以让我们所有人摆脱无休止、无聊的会议。他的公司正在开发个性化的人工智能化身,有一天这些化身将能够代表主人参加在线会议。
Otter.ai 成立于 2016 年,总部位于加利福尼亚州山景城,现已从简单的语音到文本转录服务发展到提供现场活动、会议摘要和内容搜索的自动录音。梁说,他将 Otter 视为一种生产力工具,可以提高注意力并节省每个人的时间。它内部构建了语音识别和摘要服务,并使用第三方大型语言模型合作伙伴提供人工智能聊天机器人。
人工智能交易所
这是我们广受欢迎的技术交流系列对话的副产品,将通过与人工智能开发的核心人员交谈,探讨使用人工智能的好处、风险和道德规范
这家初创公司上次融资是在 2021 年,融资 5000 万美元,声称其用户数量已接近 2000 万,但没有提供有多少人为其服务付费的信息。2022 年,它对免费用户施加了新的限制,每月最多提供 300 分钟的转录*。付费客户可以获得更多。该行业的竞争正在加剧。谷歌等大型科技公司提供自己的音频转录服务。谷歌还致力于一个在视频会议中创建头像的项目。
梁出生于中国,1991 年移居美国。在加入谷歌之前,他在斯坦福大学获得了博士学位,负责领导这家搜索巨头的定位服务。他的第一家初创公司被中国电子商务公司阿里巴巴收购。
在与《金融时报》技术评论编辑伊莱恩·摩尔 (Elaine Moore) 的对话中,梁将音频数据的访问描述为打破任何业务中的孤岛的新方法。
伊莱恩·摩尔:我们可以先谈谈您为会议创建人工智能头像的计划吗?效果如何?需要什么样的数据?这是否意味着最终我们根本不需要参加会议?
梁山姆:第一步是从用户那里收集大量数据。数据可以有多种不同的形式……。……。最重要的是会议数据。
[参加]过去七年里我参加的会议。我和风险投资家交谈过;我和顾客交谈;显然,我与我们自己的团队进行了大量的内部会议:销售团队、营销团队、招聘团队、工程团队。因此,这是我们可以使用的大量数据。我们还想使用一些其他数据。对我来说,我们可以分享我写的 Google 文档,或其他备忘录、一些电子邮件、一些 Slack 消息。
您对用户了解得越多,头像就越好。然后,我们将所有这些注入训练系统并构建一个模拟它们的模型。
当然,我们需要测试这个并评估这个系统,所以我们请我们的同事来试驾这个虚拟形象。他们可能会问它一些问题,或者我们只是将化身发送到例行会议,看看它的表现如何。我们有正在测试的原型。它距离完美还很远,所以还有很长的路要走。但它非常有前途,
EM:化身能够说话并记录正在发生的事情吗?
SL:噢,是的,绝对,绝对。最简单的会议形式是一对一会议。所以我们可以从这个开始。我们正在研究的另一项工作是我们所说的销售代理。我们培训一名能够与客户交谈、解释产品并回答客户问题的销售代理。那是另一种形式。化身试图模仿特定的人,但代理可以模仿一个人,也可以集体使用多人的知识。
EM:您过去曾说过,您可以想象一个世界,其中有人在 Otter 上记录他们的整个日常生活。你是认真的吗?
SL:从长远来看,这是一个目标。短期来看,我们的重点是业务和会议。但我们看到,有价值的对话可以随时发生:它可以在走廊里,当你遇到某人时发生;这可能发生在星巴克。
我发现对话中很多有价值的数据都被遗漏了。我希望 Otter 能够随时出现并捕捉一切。因此,尽管我们再次关注业务用例,但这也可以用于个人生活。
事实上,当我和儿子们交谈时,我正在使用 Otter。我们是空巢老人:我的一个儿子正在上大学;另一位在纽约市工作。现在想要抓住它们真的很难。我得求他们跟我打电话!所以,每当我接到电话时,我都会认为这是非常珍贵的,我会使用 Otter 来捕捉它。
EM:您是否使用 Otter 作为存储设备来帮助您搜索过去会议中所说的内容?还是为了别的事?
SL:这主要是记忆。我们创建了 Otter AI 聊天。所以,我可以使用 Otter AI 聊天来查询我过去的所有会议。事实上,你和我在8月15日进行了一次谈话,为了准备这次会议,我回顾了我们的通话以刷新我的记忆。
那是我参加的一次会议。但是,在我们公司,每周有数百次会议。显然,我不可能面面俱到,但我很想获得很多有价值的信息。所以我使用 Otter AI 聊天来查询我们公司的会议数据库。
一个很好的例子是我们的销售团队与客户的通话。我每周都会询问销售会议,以更好地了解我们的客户在寻找什么、他们的痛点是什么、他们的问题是什么以及他们的工作流程是什么。
EM:关于如何查看您未参加的会议的笔记,有报道称,一名 Otter 用户意外收到了所发生的对话的记录在他离开会议后。您如何看待用户数据安全和隐私?
SL:我们绝对非常重视安全。我们完全理解语音对话极其敏感,安全至关重要,因此我们提供了很多措施来保护用户隐私。所有数据都经过加密,我们有严格的访问控制系统。这个系统实际上与 Google Docs 没有太大区别:用户控制谁有权访问。如果您不小心与不想共享的人共享了它,您可以随时删除他们的访问权限。并且有不同的级别。
我不会说你讨论的事件是人工智能特有的。这实际上是任何人都可能发生的麦克风问题。在这种特殊情况下,据我们所知,会议结束后,一些参与者离开了,但其他参与者继续交谈,而没有意识到[会议]仍在 Otter 上捕获,并且笔记正在与所有参与者共享。事情就是这样发生的。
在分享机制中,我们提前警告用户“嘿,这条笔记正在被分享”。因此,只谈论您愿意分享的事情。”
我们一定会改进产品,使其更加突出、更加直观。但用户确实需要承担一些责任才能正确使用该工具。
EM:您在 2000 年代初期在 Google 工作,我听说您是 Google 地图上显示我们所在位置的蓝点的设计者。您就是从这里萌生了创建一家可以组织记录信息的公司的想法吗?因为,在 Google 搜索中,搜索音频或视频剪辑中的信息仍然相当困难。
SL:2006 年至 2010 年间,我在 Google 地图和定位平台上工作了四年。我于 2010 年离开 Google,在帕洛阿尔托建立了一家初创公司,该公司将跟踪移动位置,然后分析数据以提供个性化移动服务。在我们卖掉那家公司后,我意识到语音数据非常相似——从某种意义上说,大多数语音数据从未被捕获过。
我忘记了很多事情,并且很难搜索和回忆听到过的信息。因此我们决定解决这个问题,收集尽可能多的音频数据,帮助人们解决记忆问题。
这是一个共享问题。如果您考虑企业,每个部门都会召开很多会议,但大多数会议不会与其他部门的人员共享。这就造成了许多信息孤岛,导致企业效率和生产力降低。
EM:Otter成立于2016年,目前融资环境如何?与几年前相比如何?
SL:我们上一次募集资金是在 2021 年——已经过去三年半多了。我们一直非常高效。由于我们的用户是有机增长的,因此我们不需要花费太多资金来获取更多用户。而且收入增长非常迅速。
因此,我们没有迫切需要筹集新一轮资金。但我们看到风险投资界现在变得更加活跃——尤其是在美联储降息之后。我看到人们的情绪更加热情。你可以看到 OpenAI 正在进行新一轮融资,估值超过 1500 亿美元。
还有许多其他初创企业获得了大量新资金。其中许多都是非常优秀的人工智能公司。但目前市场有点泡沫。
这有点像互联网泡沫时代。其中许多公司将会消亡,只有那些拥有核心人工智能技术、构建独特商业模式的公司才能生存。许多年轻的初创企业没有自己的核心人工智能技术。他们只是调用一些第三方 API [应用程序编程接口] 并构建一个非常薄的包装器。除非他们建立了一些强大的用户或数据模型,否则它们很容易被其他公司复制。
我们构建自己的语音识别技术。我们构建了许多专有的人工智能技术。而且,你知道,我们已经处理了超过十亿次会议,因此我们拥有大量的会议数据,可以帮助微调和增强我们构建的人工智能模型。
因此,我们建立了一个人工智能飞轮,我们可以利用它来继续快速增长。为了让人工智能初创企业生存或发展,他们必须建立自己的人工智能系统,并且必须拥有大量可以利用的数据。
EM:您担心竞争吗?
SL:已经有很多竞争对手了。显然,我们看到来自两个方向的竞争。一是来自微软、Zoom、谷歌等公司的大型科技公司。他们控制视频会议系统。不过,对阵他们,我们有很多优势。我们更加灵活。我们更加敏捷——我们与平台无关。我们不仅支持一种视频会议[平台],我们还支持所有这些平台。我们还有一个非常强大的移动应用程序,人们可以用它来进行面对面的会议。没有一家大型科技公司真正专注于移动、面对面的会议。
当然,另一个方向是还有很多其他小型初创企业。至少有十几家会议助理初创公司。但他们都没有我们那么大。与所有其他初创企业相比,[我们]拥有更大的用户群和更大的数据集。
当然,每天都有新的初创企业诞生。我们正在观察市场,看看其他初创企业在做什么。我们只需要快速行动即可。
EM:您认为如何才能保持自己的利基市场?
SL:我们的价格非常有竞争力。但这还不是最重要的[事情]。最重要的是产品质量、产品功能和用户体验。
[以]谷歌为例——他们拥有无限量的现金。他们的某些类型的工程师比我们多 100 倍。但是,如果你看看过去几年的谷歌,就会发现并没有新的有趣产品问世。他们只是[没有]正确的产品心态。这就是为什么我们不害怕大型科技公司。我们的产品更加用户友好……。……。我们提供的人工智能聊天允许您查询系统中的所有会议。我们还没有看到谷歌、微软或 Zoom 做到这一点,所以我们已经远远领先于他们。
在定价方面——许多其他初创公司没有自己的人工智能模型,[并且]必须调用第三方 API 来进行语音识别和其他人工智能算法,必须支付更高的价格才能使用该 API。这确实损害了他们的利润率。所以对我们来说,我们确实有优势,因为我们自己拥有很多型号,并且可以保持较低的价格。
4小时Otter.ai 用户声称每周平均节省时间
EM:您现在专注于企业客户吗?还是着眼于扩大用户总数?
SL:我们都支持。我们有免费增值模式,允许个人用户自行使用 Otter。这些用户大多数是专业工作者。我们利用这个庞大的用户群进入企业。这种自下而上的系统与其他成功的 SaaS [软件即服务] 公司非常相似,例如 Dropbox 或 Slack。他们拥有大量渗透到大型企业的有机用户。然后,他们使用该用户群来聚合它们并创建企业合同。
EM:在大流行期间,您的用户增长非常迅速。此后增长速度是否放缓?
SL:尤其是今年,它继续快速增长。事实上,夏天的时候,人们都在度假,所以速度有点慢。但从八月下旬到九月,到目前为止,我们已经看到了创纪录的增长。这既是用户增长也是收入增长。因此,人们对人工智能和人工智能整体采用的意识越来越强。越来越多的人意识到人工智能可以真正帮助他们。
EM:最后,您对在使用转录人工智能服务进行敏感会议时可能担心幻觉或准确性的潜在商业客户有何看法?
SL:我们可以构建模型并管理模型参数以最大程度地减少幻觉。现在这种情况发生得越来越少了。当然,人们确实需要自己仔细检查重要的数字和重要的事实。但优点绝对大于缺点。
我们最近对 600 多名 Otter 专业用户进行了调查。他们说他们平均每周节省四个小时。因此人们可以利用这四个小时来放松,也许还有更多的家庭时间。或者做更多的工作。我认为这更有价值,也许他们可以容忍一点幻觉。
为简洁明了起见,本文字记录经过编辑。
*此数字已更新,以考虑基本计划分钟数的减少