作者:Decrypt / Jose Antonio Lanz
Mistral AI 是一家由前 Google 和 Meta 员工创立的法国人工智能公司,刚刚对其免费的多模式人工智能平台进行了全面改革,它几乎可以与 OpenAI 或 Anthropic 的付费产品相媲美,有时甚至超过。
这家总部位于巴黎的初创公司的人工智能工具套件现在具有网络搜索和图像生成功能以及新的视觉模型,该模型在关键基准测试中优于更大的竞争对手。
该公司推出了分析文档的更新、更新的大型语言模型以及专注于编码任务的法学硕士 Codestral。
但锦上添花的是它的用途 通量专业版生成图像,这意味着它是具有当前可用的最佳图像生成功能的多模式聊天机器人。新的 Canvas 界面可以直接进行内容编辑、定位乐聊“Mistral” 是其聊天机器人 UI 的选择名称,是一种企业级工作区工具。
米斯特拉尔在一份声明中表示:“我们不会不惜一切代价追求通用人工智能;我们的使命是将前沿人工智能交到你的手中。” 陈述与竞争对手更广泛的通用人工智能野心保持距离,这引发了专家的担忧。
该公司在 12 月份的融资中估值为 20 亿美元。
Pixtral Large 是一个 1240 亿参数的视觉模型,其性能优于 GPT-4 和 Google 的 Gemini 1.5 Pro,在 MathVista 上的准确率达到 69.4%,在 DocVQA 上的准确率达到 93.3%。它在 128,000 个令牌上下文窗口中处理多达 30 个高分辨率图像。
与此同时,与之前一样,Flux Pro 在质量和推理速度方面优于所有其他图像生成器报道经过解密。
ChatGPT 使用 DALL-E,相比之下它很原始。因此,Flux 融入 Le Chat 是一个值得欢迎的举动。
这些功能已作为“免费测试版产品”推出,让用户免费使用最新的生成式人工智能工具。米斯特拉尔没有透露打算何时开始对其工具收费。
我们对 Mistral 和 ChatGPT 聊天机器人的免费版本进行了测试。有很多相似之处——主要是在写作风格方面——但差异足以区分两者之间的一些区别。
ChatGPT 的 GPT-4o 仍然存在皇冠上的宝石l 语言模型,在复杂推理、创意写作和技术分析方面表现出无与伦比的细微差别。
它理解上下文并保持连贯、长篇对话的能力已经定义了行业标准。在广泛的测试中,GPT-4o 在从文学分析到高级编码挑战等任务中表现出了卓越的能力。
Le Chat 的 Mistral Large 2.5 虽然令人印象深刻,但在复杂的推理任务中的运行级别低于 GPT-4o。然而,它在实际应用中表现出色,提供敏捷的响应和强大的日常任务性能。虽然该模型具有多语言功能,但它的创造力往往不如 GPT-4o。
网页搜索集成
Le Chat 提供免费的网络搜索功能,用户可以通过直接引用链接访问当前信息,类似于使用传统搜索引擎的方式,但具有人工智能驱动的合成。这种集成感觉自然且不引人注目,使事实核查和研究工作流程变得非常高效。免费访问此功能代表了一个重要的价值主张。
ChatGPT 的 SearchGPT 虽然其方法更加复杂,但需要付费。它对网络集成采取独特的角度,通常提供更多的上下文分析(甚至产生幻觉一些响应)。Chrome 插件提供了与 OpenAI 语言模型功能的更深入集成,尽管许多用户可能会发现 Le Chat 的简单方法更适合日常使用。
图像生成功能
Le Chat 与 Flux Pro 的集成是图像生成领域的一个主要优势。该系统能够产生非常详细的视觉效果,并且非常遵循提示,尤其在艺术风格、准确的人体解剖学和复杂的场景构图方面表现出色。最近的基准测试将 Flux Pro 置于图像生成技术的前沿,在纹理细节和空间连贯性等领域具有明显更好的性能。
ChatGPT 的 DALL-E 3 虽然在推出时具有开创性,但现在与较新的型号相比已经显得过时了。虽然能够生成有用的图像,但它经常在复杂的提示、详细的纹理和一致的风格维护方面遇到困难,而 Flux Pro 在这些领域表现出了明显的优势。这种差距在专业级图像生成任务中尤其明显。
定制人工智能代理
Le Chat 对人工智能代理的民主方法代表了可访问性的重大转变。用户可以免费创建、定制和部署专门的代理来执行从数据分析到创意写作等任务。
另一方面,ChatGPT 维护一个两层系统。虽然免费用户可以访问预制的 GPT,但创建自定义 GPT 的能力仍然是一项高级功能。
这些 GPT 的质量非常好,并且能够通过自然语言提示配置它们是一个优势;但对创建工具和定价墙的限制限制了个性化工作流程优化的潜力。
视觉分析能力
这似乎是平局——至少在我们的第一次快速测试中是这样。GPT-4V 和 Pixtral Large 在实际应用中展示了非常相似的功能。
两者都擅长图表解释、图像理解、数学符号和空间意识。
虽然基准数据显示法学硕士、视觉模型和图像生成模型略有不同,但日常用例的实际差异并不那么显着。
这两个系统都能以令人印象深刻的准确性处理从创意写作到技术图表的所有内容,这使得它们之间的选择更多地取决于生态系统偏好而不是能力差异。
这些平台之间的选择越来越取决于具体的用例
ChatGPT 在以下方面仍然具有优势:
Le Chat 为以下方面提供更好的价值:
财务影响是决定成败的交易:Le Chat 免费提供 ChatGPT Plus 大约 80-90% 的功能,这使其成为个人用户和预算有限的小型企业越来越有吸引力的选择。
总体而言,米斯特拉尔现在提供了更好的价值主张,并且他们的模型可以为用户提供足够的服务,以证明取消订阅是合理的——至少在 Beta 测试期仍然存在的情况下。
由生成型人工智能模型 Gen 讲述的每周人工智能之旅。