您的位置: 网站首页 > 新闻资讯 > 企业要闻

大数据国家工程研究中心(中电科大数据院)开展“高质量数据集构建理论与实践”专题培训

来源:     作者:信息发布     发布时间:2026年04月24日     浏览次数:         

  当前,AI正经历从“以模型为中心到“以数据为中心的范式转变,高质量数据集成为大模型落地的关键瓶颈。如何构建高质量数据集,已成为推动AI走向真实场景、实现价值闭环的关键突破口。4月24日,大数据国家工程研究中心(中电科大数据院)组织开展了《高质量数据集构建理论与实践》专题培训,旨在深化对数据要素价值化的认知,系统掌握从数据资源到高质量数据资产的构建方法论,为行业大模型落地锻造坚实的数据底座。

图片1

  本次培训由大数据国家工程研究中心技术专家周维主讲。他从国家政策与标准规范切入,系统梳理了高质量数据集从数据资源化到数据资产化的演进逻辑,深入剖析了“场景驱动”与“数据驱动”两种建设模式的辩证关系,并围绕数据需求、采集、处理、标注、质量评估、模型验证核心环节展开讲解。

  周维指出,高质量数据集构建是一项融合“数据工程化”与“领域知识”的系统工程。当前数据标注已迈入“AI预标注+人工复核”的人机协同新阶段,唯有通过大模型驱动的自动化流水线,方能破解效率与质量的双重难题。在案例环节,他以中医药方剂推荐和某省电网作业安全管控为例,生动展示了高质量数据供给如何推动垂直行业从“事后追溯”走向“事前预警”,从“经验驱动”走向“数据驱动”。

  参训人员围绕高质量数据集在人工智能、安全合规测评、中医药配伍模型应用等关键技术问题展开研讨。

  本次培训以“线上+线下”形式举行,吸引内外部技术骨干及行业代表200余人参加。近期,工程中心(大数据院)围绕数据要素前沿技术开展系列专题培训,从《场景数据合成与利用技术》的技术攻坚,到《结构化战略思维》的认知升维,再到本次“高质量数据构建”的理论与工程实践,一“术”一“道”一“器”,环环相扣,全面构筑中心在“人工智能+”与数据要素市场化配置改革中的战略能力体系。

  未来,工程中心(大数据院)将持续锚定“一核两翼,四服五数”战略,以高质量数据集为突破口,深耕中医药、能源等特色产业,打造实数融合标杆,为“数智贵州”建设持续注入高质量数据动能。

  文/ 赵克绒 审核/韦佳

打印  |  关闭