NCSOFT 推出评估模型来验证 AI LLM 的表现

借助 VARCO Judge LLM，创建基于 AI 的服务的公司可以快速比较和评估各种 LLM 的质量

按 1几小时前

1最小阅读量

阅读最多

韩国 LS Materials 将在 IPO 前提高盈利

海外旅行增加，韩国旅游账户赤字增加

NewJeans 要求 Min 复职后 HYBE 股价下跌

现代钢铁公司将向韩国 LFP 阴极制造商供应铁粉

韩国内容巨头 YouTube 频道因黑客攻击而中断

NCSOFT Corp. 周一宣布推出 VARCOJudge LLM，韩国第一个验证人工智能 (AI) 大语言模型 (LLM) 性能和能力的评估模型。

VARCO Judge LLM 是一种评估模型，可检查其他语言模型的速度和准确度大语言模型执行任务。

通过这种模型，创建基于人工智能的服务的公司可以快速比较和评估各种大语言模型的质量，并为其服务采用最佳模型。

研发公司可以还验证其LLM的表现水平，以展示表现优势或快速识别和加强弱点。

NCSOFT解释说，VARCO Judge LLM在同级别模型中具有最高的表现，并计划利用它来改进NCSOFT 研究主管 Lee Yeon-su 表示，在快速发展的人工智能市场中，为每个行业选择和应用最佳模型的服务变得越来越重要。

VARCO Judge LLM 不仅会提高现有 LLM 服务的质量，而且还将成为人工智能业务不可或缺的工具，她补充道。

写给 Seung-Woo Lee，leeswoo@hankyung.com