交汇点讯 政策引领、标准指引、场景驱动……记者日前从江苏省数据局获悉,江苏为高质量数据集建设“划重点”,加快形成一批满足AI就绪度要求、有效训练先进模型、切实解决行业难题、具有国际影响力的标杆型数据集,为江苏人工智能创新发展提供坚实支撑。
数据是人工智能发展的基础支撑之一,高质量数据集能显著提升大模型的“智商”与逻辑推理能力,更是打通“人工智能+千行百业”落地堵点的关键。截至今年一季度,我国建成高质量数据集超11.6万个,总量超960PB(1PB=1024TB),相当于中国国家图书馆数字资源总量的336倍左右。其中,作为数据大省,江苏在医疗、交通、工业、能源、文旅等重点领域已形成高质量数据集521个、总规模超95PB。
为进一步打通“人工智能+千行百业”落地堵点,江苏将打出一套高质量数据集建设“组合拳”:
政策引领。推动出台人工智能领域专项政策,明确产业发展目标、重点任务和保障措施。支持设区市因地制宜,建设一批各具特色的“人工智能+”数据标注产业创新试验区,形成区域协同、优势互补的发展格局。
标准指引。充分发挥高质量数据集专家委员会、数据标注与数据集标准工作组作用,谱系化推进高质量数据集试点试验,构建质量可控、标准统一、复用性强的高质量数据集。
场景驱动。围绕智能制造、医疗健康、车联网、政务服务等重点领域,组织龙头企业、链主单位编制数据标注需求清单和能力清单,建设一批专家级标注行业高质量数据集,为人工智能赋能实体经济提供坚实支撑。
企业培育。积极引入需方平台企业,协同推进数据标注创新工厂建设,为企业提供标准化、专业化、智能化的标注服务环境。精细精益做好数据标注企业培育扶持,加快培育一批数据标注龙头企业和瞪羚企业、独角兽企业。
供需协同。定期组织高水平供需对接活动,推动省域优质资源与地方需求适配,畅通数据集建设相关主体供需对接,支持先行先试企业加快高质量数据集构建和应用转化。
生态共创。支持全省数据标注产业联盟发挥作用,促进“政产学研用金”密切协同。加强数据科技和学科建设,支持高校院所开设相关专业,建设产教融合实训基地,规模化培养人工智能训练师等专业人才。
新华日报·交汇点记者 聂伟













