工程中心(大数据院)开展《场景数据合成与利用技术》专题培训
为深入贯彻落实国家数据要素市场化配置改革发展部署,坚定执行“一核两翼,四服五数”战略路径,加快推进数据技术创新与行业深度融合。3月6日,一场聚焦前沿技术应用的专题分享——《场景数据合成与利用技术》培训在工程中心(大数据院)举行。本培训旨在紧跟全球人工智能发展趋势,针对当前行业面临的“数据峰值”挑战,提前布局技术储备,探索数据合成技术在中医药等垂直领域的创新应用路径。

培训由工程中心(大数据院)算法技术专家、贵州省高层次创新型“千层次”人才蔡惠民博士主讲。基于团队在数据科学领域的探索实践,蔡惠民博士系统梳理了数据合成技术的关键价值与发展脉络。针对当前真实数据获取成本高、隐私保护要求严、长尾场景覆盖难等痛点,他结合NVIDIA、智源研究院等前沿研究成果及主流开源框架,深入剖析了如何通过合成数据补充真实数据局限,为模型训练提供更高质量、更多样化的“养料”。
聚焦贵州特色中医药产业,重点阐释了中心在非结构化数据知识链萃取、思维链指令微调数据合成、安全约束负样本生成等关键技术上的探索思路。结合贵州特色中医药产业在种植、研发、诊疗等环节的数字化需求,交流探讨了如何构建高质量、高可信的特色数据集,为“人工智能+”在中医药领域的深度融合提供坚实的数据支撑。

此次分享不仅是前沿技术的观点碰撞,也是一次深度的概念普及。互动环节中,与会人员就合成数据的质量评估、领域知识库融合、模型安全对齐等实际工程问题展开了热烈讨论,来自贵阳市投资促进局、北京致远、上海三思等多家单位的代表也积极参与交流,共同探讨技术协同与产业赋能的潜在可能。
本次交流培训以“线上”+“线下”形式举行,吸引了内外部技术骨干、研发人员及政府企事业单位代表共计60余人参加。作为中心常态化技术交流的一部分,此类分享旨在对内凝聚技术共识、激发创新思路,对外传递专业观点、提升行业影响力。未来,工程中心(大数据院)将持续围绕“人工智能+”及数据要素市场化配置的改革方向,通过扎实的技术攻关与开放的生态合作,推动数据合成等前沿技术从概念走向实践应用。
文/图 苏致龙 审核/韦佳



