DeepSeek 的新人工智能模型似乎是迄今为止最好的“开放”挑战者之一TechCrunch
2024-12-26 19:44:50
中国一家实验室在许可下发布了 DeepSeek V3,这是迄今为止最强大的开放人工智能模型之一。该模型由 DeepSeek 开发,在各种基准测试中都超越了开放可用和封闭的人工智能模型,包括 Codeforces 上的编码任务。它在 14.8 万亿个代币上训练了 6710 亿个参数,其性能优于 Meta 的 Llama 3.1 405B 和 OpenAI 的 GPT-4o 等竞争对手。DeepSeek V3 在两个月内使用大约 2,048 个 GPU 进行了训练,成本约为 600 万美元,只是此类模型通常相关成本的一小部分。然而,该模型遵守中国有关内容和政治观点的规定。