热搜词:

关注2025智博会|高质量数据集有何作用? “重庆AI麻辣面”用烟火气来讲

第1眼TV-华龙网讯(记者梁浩楠)9月5日,作为2025世界智能产业博览会重要活动,2025可信数据空间高质量数据集生态大会在渝举行。会上,一款名为“重庆AI麻辣面”的卡通形象智能小助手,以通俗语言讲解高质量数据集工作指南,令人印象深刻。

数据作为新型生产要素,不仅是驱动产业变革的核心引擎,更是铸造未来竞争格局的战略性资源。其中,可信数据空间是实现数据可控、可计量、可用不可见的关键基础设施,高质量数据集则是培育新质生产力,训练人工智能大模型的高质量粮仓,这二则如同车辙双轮两肢两翼,共同铸就了数字价值充分释放的坚实道路。

何为高质量数据集?它是经过采集、加工等数据处理,可直接用于开发和训练人工智能模型,且经应用场景验证能有效提升模型性能的数据集合。模型的性能上限,从根本上取决于高质量数据集的“喂养”。

“我们打造‘重庆AI麻辣面’,就是想让大家明白:打造高质量数据集,其实道理和煮一碗地道的重庆小面一样——得先有好‘面’(全面的数据集),再添‘麻’味(数据采集的高效化),最后浇上‘辣’油(数据治理的高质量),才能在味蕾上爆出那股子直击灵魂的‘泼辣’劲。”市大数据局相关负责人介绍。

在建设高质量数据集过程中,数据集类似于“面”,是“骨架”,无论是自动驾驶的路况判断,还是智慧金融的风险识别,没有数据集的支撑,再先进的算法也无用。

数据采集的高效化、高质量,则类似于小面的麻、辣,要直击味蕾:在建设高质量数据集过程中,数据采集类型、规模、标准、方式以及采集规范明确后,就能在短时间内让数据“入味”,让原本无序的采集像舌尖触电般迅速完成。随后,通过精准的标注、精细的清理、严格的管控等方式,让数据集成为模型看得明白、学得懂、能有效提升性能的高质量数据集,才能推动识别准确率瞬间飙升。

近年来,重庆坚持以应用为导向,助力构建“33618”现代制造业集群体系和“416”科技创新布局,已打造一批产业亟需、规模庞大、模态丰富、质量过硬、行业特色的高质量数据集。

如在智能网联汽车领域,重庆联合中国汽研、长安汽车、赛力斯汽车等龙头企业,建设行业可信数据空间,赋能研发制造供应链全链条;在医保领域,探索建设行业可信数据空间,在保障安全与隐私的前提下,推动数据服务人民生命健康等。

今年智博会上,重庆首批发布85个高质量数据集建设清单。如在汽车领域,加快建设新能源汽车动力电池安全测评、智能驾驶算法研发等数据集,为万亿级产业集群装上“数据新引擎”;在智能制造领域,加快建设摩托车生产制造与供应链等数据集,赋能提升生产效能、促进产业链协同等。根据规划,到2027年,重庆将高水平建设400个高质量数据集。