作者:Hayden Field
writer.com的首席执行官梅·哈比卜出席了与保时捷和One&Only One Za'abeel合作举办的Harper's Bazaar At Work峰会,活动于2023年11月21日在英国伦敦的OWO拉菲酒店举行。
戴夫·贝内特 | 盖蒂图片社
位于旧金山的人工智能初创公司Writer推出了一款大型产品人工智能为了与OpenAI、Anthropic等企业的产品竞争,模型Wednesday应运而生。但是,与一些竞争对手不同,它不需要花费太多资金来训练其人工智能。
该公司告诉CNBC,它花费了约70万美元训练其最新模型,包括数据和GPU,相比之下,竞争对手的初创公司则需要花费数百万美元来构建自己的模型。其战略已引起了投资者的关注。
据一位熟悉内情的人士向CNBC透露,Writer正在以19亿美元的估值筹集高达2亿美元的资金。这几乎是该公司在2023年9月进行1亿美元融资时50多亿美元估值的四倍。
该公司通过使用合成数据或由AI创建的数据来降低成本。这种数据被设计用来模拟通常输入模型的真实世界信息,同时不损害隐私,并且正成为一种更为流行的训练方法。
AI研究人员在六月修订的一项研究发现,如果当前的人工智能发展趋势继续下去,科技公司将会“完全耗尽”公开可用的训练数据。2026年至2032年之间写道:“由人类生成的公共文本数据无法在本十年内持续扩展。”
亚马逊在训练Alexa时使用了合成数据,元数据使用它对其Llama模型进行了微调,和微软据称支持OpenAI正在将其纳入其模型中职位描述公司发布。
然而,一些专家警告说,合成数据应谨慎使用,因为它有可能降低模型性能并加剧现有偏见。
Writer的联合创始人兼首席技术官Waseem Alshikh告诉CNBC,Writer多年来一直在开发其合成数据管道。
阿尔什希克说:“业界对‘合成’数据的定义存在一些混淆。” “为了明确,我们不会使用虚假或幻觉数据来训练我们的模型,也不会用模型生成随机数据……我们将真实的、事实性的数据转换为专门为模型训练而结构化得更清晰和干净的合成数据。”
该公司提供的生成式人工智能允许企业客户使用其大型语言模型(LLM)来生成类似人类的文本,适用于从领英帖子到职位描述再到使命宣言等各种场景。此外,该技术还可用于分析和总结数据或文本,并构建用于市场分析等领域的定制AI应用程序。该公司拥有超过250家企业客户,包括埃森哲、优步、Salesforce、欧莱雅和先锋集团,在支持、IT、运营、销售和市场营销等多个领域使用这些技术。
生成式人工智能市场正准备迎接万亿美元以内截至2024年,根据PitchBook的数据,投资者已向498笔生成式AI交易投资了268亿美元,而该行业的公司在2023年筹集的资金达到了259亿美元,比2022年增长了超过200%。