贵州日报天眼新闻 | 大数据国家工程研究中心开展“高质量数据集构建理论与实践”专题培训
编者按:近日,贵州日报天眼新闻关注大数据国家工程研究中心“高质量数据集构建理论与实践”专题培训情况,详情如下:

近日,大数据国家工程研究中心(中电科大数据院)组织开展《高质量数据集构建理论与实践》专题培训,旨在深化对数据要素价值化的认知,系统掌握从数据资源到高质量数据资产的构建方法论,为行业大模型落地锻造坚实的数据底座。
当前,AI正经历从“以模型为中心”到“以数据为中心”的范式转变,高质量数据集成为大模型落地的关键瓶颈。如何构建高质量数据集,已成为推动AI走向真实场景、实现价值闭环的关键突破口。
本次培训由大数据国家工程研究中心技术专家周维主讲。他从国家政策与标准规范切入,系统梳理高质量数据集从数据资源化到数据资产化的演进逻辑,深入剖析了“场景驱动”与“数据驱动”两种建设模式的辩证关系,并围绕数据需求、采集、处理、标注、质量评估、模型验证核心环节展开讲解。
周维说,高质量数据集构建是一项融合“数据工程化”与“领域知识”的系统工程。当前数据标注已迈入“AI预标注+人工复核”的人机协同新阶段,唯有通过大模型驱动的自动化流水线,方能破解效率与质量的双重难题。在案例环节,他以中医药方剂推荐和某省电网作业安全管控为例,生动展示了高质量数据供给如何推动垂直行业从“事后追溯”走向“事前预警”,从“经验驱动”走向“数据驱动”。
本次培训以“线上+线下”形式举行,吸引内外部技术骨干及行业代表200余人参加。参训人员围绕高质量数据集在人工智能、安全合规测评、中医药配伍模型应用等关键技术问题展开研讨。



