全国首张!新华报业高质量数据集通过国家级评测
2025-12-15 19:56  来源:交汇点新闻  作者:聂伟  
1

交汇点讯 12月13日,新华报业传媒集团(以下简称“新华报业”)“新华·文风训练数据集”获得了由中国信通院颁发的高质量数据集检测证书。据悉,这是全国首张传媒领域高质量数据集检测证书,标志着新华报业在数据治理、数据集标准化建设与价值转化方面的实践获国家级权威认可,也为传媒领域数据要素合规流通与高效应用提供了可借鉴的“新华方案”。

这张证书的含金量有多高?中国信通院的评测结果,对标国际数据治理规则,针对数据采集、清洗、标注到流通应用等全链条构建评测规范,是国内企业参与国内数据交易、跨境数据流通及行业合作的重要信用凭证,有助于显著降低数据应用方的信任成本与合规风险,在行业内具备高度认可度。

为什么是新华报业拿到了全国首张传媒领域高质量数据集检测证书?据悉,中国信通院此次围绕数据集质量、合规性、应用价值等核心维度,严格依据数据智能服务产业相关标准,对“新华·文风训练数据集”开展了专业化的评测。该高质量数据集,是依托新华高质量数据集运营管理系统汇聚的海量真实稿件数据,构建了覆盖13种典型文风的基准数据集。通过语义特征匹配建模、专家标注筛选与多轮模型迭代调优,持续优化样本筛选与数据归集算法,为文风生成模型提供精准、多元的训练语料。

记者还了解到,2025年以来,新华报业持续深耕文化传媒领域数据要素,在数智融合、数据资产化、技术应用等关键方向取得系列进展:先后获评国家级高质量数据集先行先试单位,牵头制定全国首个省级传媒数据分类分级指南,完成“新华大模型”国家网信办备案,并以“数智媒体多源数据融合与应用服务”项目荣获“数据要素×”大赛全国优秀奖,逐步构建“标准制定—技术研发—场景应用”的完整数据生态闭环。

新华日报·交汇点记者 聂伟

标签:
责编:刘霞