Hi, 请登录

国家数据局:到2025年年底全国已建成的高质量数据集超过10万个相当于中国国家图书馆数字资源总量的310倍左右

  邦度数据局局长刘烈宏正在现场默示,到本年3月,我邦日均Token(词元)的挪用量,依然赶上了140万亿。比拟2024岁首的1000亿拉长了1000众倍,比拟2025岁暮的100万亿,三个月年光又拉长了40%众。日均Token挪用量的大宗加众,充斥证实中邦的?

国家数据局:到2025年年底全国已建成的高质量数据集超过10万个相当于中国国家图书馆数字资源总量的310倍左右

  图片起原:每经记者周逸斐现场拍摄 到本年3月,我邦日均Token挪用量比拟2024岁首的1000亿拉长1000众倍!

  寻常的智能助手、家产端的智能明白等,离不开海量高质地的数据行为撑持,邦度数据局正在促进高质地数据集赋能进展方面做了哪些管事,接下来另有哪些调节?

  刘烈宏默示,邦度数据局高度注重数据因素赋能立异进展的管事,针对高质地数据集设置“小和散”的题目,会同26个部分机合采选了72家高质地数据集设置链主单元、140个先行先试管事单元和104个榜样案例,修筑了链主动员、众方插手、拉拢攻合、共筑共享、团结共赢的高质地数据集设置生态,延续激动高质地数据集的设置。

  为激动数据标注家产进展,邦度数据局组织了成都、沈阳、合肥、长沙、海口、保定、大同7个继承数据标注先行先试设置使命的都市,出台了《合于鼓动数据标注家产高质地进展的奉行主睹》,采选出47个数据标注精良案例,教导举办了7次数据标注的供需对接会。下一步,邦度数据局将面向科技立异强、进展根源好、家产特质优的区域,聚焦“常识繁茂型”和“时间驱动型”这两个目标,梯次组织一批时间前辈、特质明显、高效赋能的数据标注家产立异试验区。

  刘烈宏进一步指出,邦度数据局还延续造就“为高质地数据付费”的市集共鸣,激动行业高质地数据集正在数据买卖所挂牌、上架、买卖。支撑数据畅通办事平台、数据商等机构供应畅通买卖的办事,怂恿各式数据畅通办事机构索求众样化的高质地数据集畅通使用形式,激动高质地数据集供需有序对接,支撑行业高质地数据集滚动起来。

  我邦高质地数据集的设置管事赢得了阶段性的收获,截止到2025年岁暮,宇宙已筑成的高质地数据集赶上了10万个,总体量赶上了890PB(计划机存储容量单元),相当于中邦邦度藏书楼数字资源总量的310倍驾驭。到本年3月,我邦日均Token的挪用量,依然赶上了140万亿,比拟2024岁首的1000亿拉长了1000众倍,比拟2025岁暮的100万亿,三个月年光又拉长了40%众。

  “日均Token挪用量的大宗加众,充斥证实中邦的人工智能进展进入了急迅拉长阶段,使用场景正在络续深化,从能对话到能计划施行的智能体,中邦人工智能家产的比赛力也明显巩固,现正在热议的Token出海,即是家产比赛力巩固的一个标记。从数据的维度来看,也标记着数据集的需要正在大宗加众,的价钱正在络续开释,赋能人工智能立异进展进入了良性互动的阶段。”刘烈宏先容。

  刘烈宏夸大,下一步,邦度数据局将延续促进数据赋能人工智能立异进展,协同各方深刻奉行新一轮的高质地数据集设置活动铺排,包含强基扩容、标注攻坚、提质增效、使用赋能、收拾办事、价钱开释六大专项活动,以场景需求为牵引,加快促进先行先试的管事,打制时间可行、适用便捷、质地保护的AI-Ready(AI停当度)高质地数据集,达成高质地数据集需要的量质擢升。

  《逐日经济音讯》记者还留意到,不日,工业和音信化部印发报告,启动工业数据筑基活动,发展面向人工智能赋能的高质地行业数据集设置先行先试。后续将若何进一步促进?

  工业和音信化部音信时间进展司司长王彦青默示,下一步,为做好先行先试的管事,工业和音信化部要持续做好三方面的管事。一是要增强撑持保护。拉拢地方的工信以及数据主管部分,做好对先行先试拉拢体的资源保护和教导支撑,实时跟进治理碰到的题目,会聚经历,加快变成可扩大的功效。

  二是要加强策略教导。激动出台数据因素赋能的策略文献,印发工业场景数据因素使用参考指引,增强进展的教导和形式的宣介。

  三是要造就杰出的生态。加快激动工业数据圭臬的研制,进展强壮数据筹议、数据处理、数据标注等数据办事企业,支撑举办一批时间研讨会、供需对接会等,同时要做强做优人工智能开源社区,打制高质地开源数据资源团圆的高地。尤其是本年期近将举办的峰会上,工业和音信化部也将主办数据因素赋能的专题聚会,也会邀请先行先试单元的代外来分享少少经历。同时还要启动2026年数据因素赋能新型工业化的大赛。

相关推荐

评论

  • 昵称 (必填)
  • 邮箱
  • 网址