我国日均词元(Token)调用量突破 140 万亿

  在 3 月 24 日国新办举行的新闻发布会上,国家数据局局长刘烈宏表示,到今年 3 月,我国日均 Token(词元)的调用量已经超过了 140 万亿,相比 2024 年初的 1000 亿增长了 1000 多倍,相比 2025 年底的 100 万亿,三个月时间又增长了 40% 多。

  “日均 Token 调用量的大量增加,充分表明中国的人工智能发展进入了快速增长阶段,应用场景在不断深化,从能对话到能决策执行的智能体,中国人工智能产业的竞争力也显著增强。”刘烈宏说。

  数据显示,截止到 2025 年年底,全国已建成的高质量数据集超过了 10 万个,总体量超过了 890PB,相当于中国国家图书馆数字资源总量的 310 倍左右。

  刘烈宏表示,数据集的供给大量增加,数据要素的价值不断释放,数据要素赋能人工智能创新发展进入了良性互动的阶段。

  据悉,下一步国家数据局将持续推进数据赋能人工智能创新发展,协同各方深入实施新一轮的高质量数据集建设行动计划,包括强基扩容、标注攻坚、提质增效、应用赋能、管理服务、价值释放六大专项行动,以场景需求为牵引,加快推进先行先试的工作,打造技术可行、实用便捷、质量保障的 AI-Ready(AI 就绪度)高质量数据集,实现高质量数据集供给的量质提升。