争夺人工智能标准话语权!全国首个可信AI智能体测试床在南京宣布启动建设
2025-04-18 07:13  来源:交汇点新闻  作者:付奇  
1

交汇点讯 417日,记者从南京市工信局获悉,全国首个可信AI智能体测试床在“人工智能赋能新型工业化深度行”南京站活动中宣布启动建设,意味着中国在人工智能产业协同与标准话语权争夺中迈出关键一步。

近年来,智能体作为大模型的关键应用模态,能够将模型能力转化为解决实际问题能力,在跨场景协作、任务执行等方面展现出巨大潜力。

但是,智能体在实际应用落地过程中,也面临工作流程繁杂、协作逻辑不清晰、身份可信性存疑、应用可靠性参差等诸多挑战。

此次中国信通院联合联通数科、中国移动研究院、华为、百度、VIVO、中兴通讯等单位,在南京启动可信AI智能体测试床建设,旨在构建覆盖多智能体协同测试的标准化环境,对智能体的理解分析、规划决策、通信交互、任务执行等能力进行全面验证和优化,推动智能体技术从实验室走向产业规模化应用。

为此,中国信通院提出“可信AI智能体测试床”的三大核心能力架构,以期破解智能体落地难题,构建一体化测试体系——

在资源配置层,系统配置智能体测试床的基础资源,包括计算设施、数据资源、网络设施、操作系统、基础软件等;在环境构建层,主要构建智能体测试环境,包括运行脚本调试、数据可视分析等基础测试环境,以及模型接入、智能体部署等运营管理环境;在任务测试层,重点面向MCP协议验证测试、单智能体基准测试、多智能体协同测试等典型任务建设测试体系。

所谓智能体“测试床”,其核心任务是通过三类测试场景,推动智能体技术的标准化与产业协同。

其中,MCP协议测试验证智能体通信协议的一致性、服务性能和扩展性,解决跨平台互联互通问题;单智能体基准测试评估智能体在感知、规划、执行等维度的能力,例如动态环境感知、任务拆解、数据库操作等;多智能体协同测试模拟复杂任务场景如智慧城市、工业自动化,验证多智能体协作的可靠性与效率。

测试床的标准化成果将直接服务于金融、制造、交通等领域,帮助企业降低30%的测试成本,提升50%的协作效率。

此次联合建设,还将构建产业协同新范式,参与企业将共享测试数据与场景资源,形成“技术研发测试优化商业落地”的闭环。

例如华为贡献其边缘计算与通信协议技术,优化智能体在高并发场景下的稳定性百度基于其大模型能力,提供自然语言交互与复杂任务规划的支持;吉利汽车则开放智能驾驶仿真环境,推动车联网场景下的协同测试;测试床还将与蚂蚁数科等企业的可信智能体技术平台联动,确保智能体在知识工程、交豆安全等环节的可靠性,降低产业化应用的潜在风险。

中国信通院相关负责人表示,下一步将重点完善测试床的评估标准与工具链,并计划于2025年底发布首份《可信AI智能体测试指南》。

新华日报·交汇点记者 付奇

标签:
责编:王建朋