Facebook 内部人士为 AI 时代构建内容审核 |TechCrunch
作者:Rebecca Bellan
当 Brett Levenson 于 2019 年离开 Apple 前往 Facebook 领导商业诚信时,这家社交媒体巨头正处于困境之中。剑桥分析公司后果。当时,他认为可以通过更好的技术简单地解决 Facebook 的内容审核问题。
他很快意识到,这个问题比技术更严重。他说,人类审查员需要记住一份 40 页的政策文件,该文件已被机器翻译成他们的语言。然后,他们对每条被标记的内容有大约 30 秒的时间来决定,不仅要决定该内容是否违反规则,还要决定如何处理:阻止它、禁止用户、限制传播。利文森表示,这些快速呼叫的准确率仅略高于 50%。
“这有点像抛硬币,看人类审核员是否真的能够正确地处理政策,而且这已经是伤害已经发生很多天之后了,”莱文森告诉 TechCrunch。
在一个充满灵活且资金充足的对手的世界中,这种延迟的、反应性的做法是不可持续的。人工智能聊天机器人的兴起只会加剧问题,因为内容审核失败导致了一系列引人注目的事件,例如聊天机器人为青少年提供自残指导或AI 生成的图像逃避安全过滤器。
莱文森的挫败感催生了“政策即代码”的想法,一种将静态政策文档转变为与执行紧密耦合的可执行、可更新逻辑的方法。这种洞察力促成了月球弹跳据 TechCrunch 独家获悉,该公司周五宣布已筹集 1200 万美元资金。此轮融资由 Amplify Partners 和 StepStone Group 共同领投。
Moonbounce 与公司合作,在内容生成的任何地方(无论是由用户还是由人工智能生成)提供额外的安全层。该公司已经训练了自己的大型语言模型来查看客户的保单文档、在运行时评估内容、在 300 毫秒或更短的时间内提供响应并采取行动。根据客户偏好,该操作可能看起来像是 Moonbounce 的系统在内容等待稍后人工审核时减慢分发速度,或者可能会立即阻止高风险内容。
如今,Moonbounce 服务于三个主要垂直领域:处理用户生成内容(例如约会应用程序)的平台;人工智能公司打造角色或同伴;和人工智能图像生成器。
Techcrunch 活动
加利福尼亚州旧金山 | 2026年10月13-15日
Levenson 表示,Moonbounce 每天支持超过 4000 万条评论,并为该平台上超过 1 亿的每日活跃用户提供服务。客户包括人工智能配套初创公司 Channel AI、图像和视频生成公司 Civitai 以及角色扮演平台 Dippy AI 和 Moescape。
“安全实际上可以成为一种产品优势,”Levenson 告诉 TechCrunch。——从来没有,因为它总是稍后发生的事情,而不是你可以真正构建到你的产品中的事情。我们看到我们的客户正在寻找真正有趣和创新的方法来使用我们的技术,使安全成为差异化因素,并成为他们产品故事的一部分。”
Tinder 信任与安全主管最近解释约会平台如何使用这些类型的 LLM 支持的服务将检测准确性提高 10 倍。
“内容审核一直是困扰大型在线平台的一个问题,但现在法学硕士已成为每个申请的核心,这一挑战更加艰巨,”Amplify Partners 普通合伙人 Lenny Pruss 在一份声明中表示。“我们投资 Moonbounce 是因为我们设想这样一个世界:客观、实时的护栏将成为每个以人工智能为媒介的应用程序的支柱。”
在聊天机器人被指控将青少年和弱势用户推向人工智能之后,人工智能公司面临着越来越大的法律和声誉压力。自杀xAI 的 Grok 等图像生成器已被用来创建未经同意的裸体图像。显然,内部安全护栏正在失效,这正在成为一个责任问题。莱文森表示,人工智能公司越来越多地在自己的围墙之外寻求帮助,以加强安全基础设施。
“我们是位于用户和聊天机器人之间的第三方,因此我们的系统不会像聊天本身那样被上下文淹没,”Levenson 说。“聊天机器人本身必须记住之前出现过的数以万计的令牌……我们只担心在运行时执行规则。”
Levenson 与他的前苹果同事 Ash Bhardwaj 一起经营这家 12 人公司,后者此前曾为这家 iPhone 制造商的核心产品构建了大规模云和人工智能基础设施。他们的下一个重点是一种称为“迭代引导”的功能,该功能是为了应对诸如以下情况而开发的:2024 年佛罗里达一名 14 岁男孩自杀他痴迷于角色人工智能聊天机器人。当出现有害话题时,系统不会直接拒绝,而是拦截对话并重定向,实时修改提示,推动聊天机器人做出更积极的支持性响应。
“我们希望能够在我们的操作工具包中添加一种能力,引导聊天机器人朝着更好的方向发展,本质上是接受用户的提示并对其进行修改,以迫使聊天机器人不仅成为一个有同理心的倾听者,而且在这些情况下成为一个有帮助的倾听者,”Levenson 说。
当被问及他的退出策略是否涉及被 Meta 这样的公司收购,从而使他在内容审核方面的工作得到圆满解决时,Levenson 表示,他认识到 Moonbounce 非常适合他的老雇主的团队,以及他自己作为首席执行官的受托责任。
“我的投资者会因为我这么说而杀了我,但我不愿意看到有人收购我们,然后限制技术,”他说。– 就像, – 好吧,现在这是我们的了,其他人都不能从中受益。 –