旧金山6月3日``网络链和人工智能的14个领先组织,包括网络,特征者,众人,以及其他人,今天宣布了Crypto AI基准联盟(CAIBA)的形成。社区主导的计划旨在建立透明的标准,用于评估加密生态系统中的AI模型和代理。
创始成员 - 炼金术,网络,特征者,Goldsky,Iosg,Lazai,Magic Newton,Metis,myshell,myshell,opengradient,rootdata,Soncdata,Soncient,Surf和Thirdweb都在贡献数据集,工具和域名知识,以构建基础标记框架。每个基准测试都将包括任务,参考答案和评分脚本,该脚本在允许时在诸如GitHub之类的平台上发布在诸如GitHub和Huping Face的平台上。
AI模型在加密货币中发挥了越来越大的作用,从交易工具到研究助理的所有功能。然而,大多数现有的AI基准都无法解决加密行业的具体需求。Caiba的目标是通过开发特定于加密的基准测试来缩小这一差距。
网络联合创始人瑞安·李(Ryan Li)说,透明,严格的测试至关重要。模型不仅必须正确回答,而且还必须可靠地采取行动,以便用户可以自信做出决定。”
联盟的第一个版本是Crypto AI代理商(CAIA)的基准,现在已经存在。CAIA在三个关键领域评估AI:
知识:准确回答协议和令牌相关的问题。
规划:绘制多步任务。
行动:使用Block Explorer和API等工具来完成任务。
CAIA包括与令牌学,OnChain分析,项目研究和交易工作流有关的任务。评估的模型包括通用LLM,例如GPT-4O,Claude 4,Gemini 2.5和DeepSeek-1,以及加密本地模型。
Caiba的目标是通过创建开放的,特定于域的基准来反映这些工具实际使用的方式,使Crypto中的AI更加值得信赖。通过在现实世界任务上测试模型,联盟建立了一个共享标准,用于评估加密环境中的性能。
其他基准已经在开发中,联盟向新的贡献者开放。开发人员,研究人员和协议可以通过提交模型进行评估或提出新任务来参与其中。
Crypto AI基准联盟是一项由社区管理的计划,该计划设定了在特定于加密特定环境中评估AI模型性能的标准。通过开放的数据集,可重复的任务和公共排行榜,CAIBA提供了帮助开发人员,研究人员和协议测量和改进区块链应用中使用的AI系统的工具。有关更多信息,请访问caiba.ai。该出版物由客户提供。
Cointelegraph不认可,也不对此页面上的任何内容,准确性,质量,广告,产品或其他材料负责或负责。读者应在采取与公司有关的任何行动之前进行自己的研究。对于由或依赖于新闻稿中提到的任何内容,商品或服务造成或依赖的任何损害或损失,CoIntelegraph概不负责。