我国首部大模型国标落地完成华为盘古、讯飞星火等模型场景验证

频道：人工智能日期：2025-12-27 浏览：422

快科技12月27日消息，据中国国家市场监管总局消息公布，近日，《人工智能大模型》系列国家标准正式实施。作为首部聚焦通用大模型的国家标准，该系列填补了技术评价体系空白，明确性能、安全与服务能力要求，配套评测能力已获中国合格评定国家认可委员会认可。

基于此构建的“求索”-LMBench评测基准，整合方法、数据集与自动化平台，成为行业公认的“能力标尺”。评测体系已形成主流大模型白名单，为央企、国企选型提供依据，并支撑中国石化、南方电网等建设行业大模型，完成对华为盘古、讯飞星火、中国移动“九天”等模型的场景验证。

截至目前，标准工具完成千余项评测任务，调用大模型超95万次，精准识别幻觉控制、内容安全等共性问题，助力近30家厂商技术迭代，推动形成“研发—评测—应用—升级”闭环。值得一提的是，标准国际化也同步推进。面向东盟编制英语、老挝语、高棉语版本，填补了区域空白；中国开源模型架构已被新加坡等国项目采用。

关键词：大模型国标

我国首部大模型国标落地 完成华为盘古、讯飞星火等模型场景验证