加入我们的每日和每周时事通讯,了解有关行业领先人工智能报道的最新更新和独家内容。了解更多
月梦今天,它从秘密模式中脱颖而出,获得了 450 万美元的种子前融资,并提出了一个激进的主张:就人工智能模型而言,越小越好。该初创公司的支持者是费利西斯风险投资公司,Microsoft 的 M12 GitHub 基金, 和登高建立了一个视觉语言模型,该模型仅需要 16 亿个参数,但其性能却可以与四倍于其大小的模型相媲美。
该公司的开源模式已经引起了广泛关注,下载量超过 200 万次,GitHub 星数达到 5,100 颗。Moondream 首席执行官兼前 AWS 技术总监 Jay Allen 表示:“它的特别之处在于,它是最小的模型之一,具有高精度,而且效果非常好。”– 它可以非常轻松、快速地在任何地方运行。它甚至可以在 iOS 手机上运行。
边缘计算遇上企业人工智能:Moondream 如何解决云成本危机
这家初创公司解决了企业人工智能采用中日益严重的问题:云计算的天文数字成本和隐私问题。Moondream 的方法允许人工智能模型在从智能手机到工业设备的设备上本地运行。
“随着人工智能进入越来越多的应用程序,我认为我们在想要享受人工智能的所有好处,但又不一定希望将我们的整个生活直播到云端之间左右为难,”艾伦告诉 VentureBeat。“我的偏好是尽可能靠近边缘进行操作,这样我就可以控制自己的隐私。”
实际应用:从零售库存到工厂车间智能
早期采用者已经发现了该技术的多种应用。零售商使用它通过移动扫描进行自动库存管理。运输公司将其部署用于车辆检查,而具有气隙系统的制造工厂则在本地实施人工智能以进行质量控制。
技术成果突出。最近的基准测试显示 Moondream2 实现了80.3% 准确度在 VQAv2 上和GQA 评分为 64.3%– 与更大的型号竞争。该系统的能源效率令人印象深刻,首席技术官 Vik Korrapati 指出“每个代币消耗约为每十亿个参数 0.6 焦耳。”
以弱胜强:小团队如何对抗科技巨头
虽然主要科技公司专注于需要大量计算资源的大规模模型,但 Moondream 的目标是实际实施。“这个领域的许多公司都专注于通用人工智能,但这最终成为了一个很大的干扰,”科拉帕蒂说。“我们专注于感知问题以及如何按照开发人员所需的尺寸和外形提供尖端的多模式功能。”
公司现推出月梦云服务,旨在简化开发,同时保持边缘部署的灵活性。“他们想要的是从类似云的产品开始的最简单途径,这样他们就可以随意使用它,”艾伦说。“但一旦他们这样做了,他们就不想感觉自己被锁定了。”
这种混合方法引起了开发人员的共鸣。该公司在开源社区中建立了强大的追随者,艾伦将其归因于他们的“黑客、开源精神”和透明的开发流程。
至于来自科技巨头的竞争,艾伦对 Moondream 的集中战略仍然充满信心。“对于许多这样的大公司来说,这往往是他们的 8,000 个优先事项之一,”他说。“似乎没有多少公司像我们一样专注于围绕多模式提供无缝的开发人员体验。”
该公司预计未来 12 个月内视觉语言模型将被企业广泛采用,但 Korrapati 警告说“谈论人工智能的时间表是一场危险的游戏。”
凭借新的资金,Moondream 计划扩大其团队,包括招聘全栈工程师在其西雅图总部。该公司的下一个挑战将是扩展其技术,同时保持决定其早期成功的效率和可访问性。