当前位置:首页 > 综合 > 正文

500名博士反向“蒸馏” 全国重点实验室探索人机高阶智能

2026-05-11 19:08:12 综合

中经记者 索寒雪 北京报道

近日,蒸馏在第九届数字中国建设峰会“数字交通与物流”分论坛上,名博北京大学博雅特聘教授、士反数据空间技术与系统全国重点实验室主任黄罡教授表示,向全实验室正在收集国家海量数据和私域数据,国重高阶以探索形成高阶智能。点实

黄罡介绍,验室今年将面向500名博士生开展相关实践,探索每名博士生获得1万元支持,人机让他们与大模型对话、蒸馏使用智能体辅助论文写作,名博并为每名博士生建设一个个人数据空间。士反

他向《中国经营报》记者介绍,向全500名博士生将分为5个领域,国重高阶每个领域100人。点实

数据枯竭怎么办

当前,人工智能领域正面临高质量数据不足的挑战——互联网上公开可获取的公域数据日益接近枯竭。对于大模型而言,单纯依赖数据增量,对模型参数优化已难以持续产生显著效果。

黄罡表示,真正具有高价值、大体量的数据往往掌握在机构和个人手中。这些私域数据不仅知识密度高,而且在通用人工智能(AGI)的五个发展阶段——从聊天体、思维体、智能体、创新体到组织体——越高级的阶段,对私域数据的依赖越强,获取难度也越大。

Epoch AI是一家非营利研究机构。该机构预测,高质量文本数据将于2028年耗尽。在数据极限来临之际,谁能掌握私域数据,或者形成真正的数据合成能力并进行模型训练,谁就可能在行业竞争中取得关键优势。

黄罡介绍,数据空间技术与系统全国重点实验室作为数据领域唯一的全国重点实验室,正在推进一项重要工程:探索如何将我国的海量数据、私域数据整合为高阶智能。

据了解,该项目要求博士生通过与大模型对话、使用智能体工具辅助论文写作,并将相关过程沉淀到个人数据空间中。这些个人数据空间将与国家可信数据空间联通,形成跨领域的数据协同网络。

专家的数字分身

黄罡表示,如果某企业的可信数据空间能够高效利用博士生的最新科研数据,则表明其创新能力更强;反之,若仅停留在开放数据的效率提升层面,则难以解决真正的新问题。实验室希望通过这种实践,探索AI时代科技创新与产业创新融合的新模式。

据了解,利用人工智能技术对收集到的数据进行分析,提取出人物的核心思维方式、决策逻辑、语言风格、工作习惯等特征,可以形成该人物的数字分身。

黄罡还在不久前介绍了私域数据“专家形态”的广域流通利用模式。

其主要内容包括两类:一是数智化身模式,即真人专家将个人数据发布到个人数据空间,自动生成和增强智能体化身,化身通过数联网自主参与各种任务;二是人机混成模式,即真人专家发布各种任务到数联网,数联网上的真人专家、智能体化身及其他智能体协同完成任务。

(编辑:郝成 审核:朱紫云 校对:颜京宁)

最近关注

友情链接