官方定调:Token 中文名确认为“词元”

  中国政府网转发了《人民日报》援引国家数据局的消息称,2024 年初,中国日均词元(Token)调用量为 1000 亿;至 2025 年底,跃升至 100 万亿;今年 3 月,已突破 140 万亿,两年增长超千倍。

  此前,清华大学可持续社会价值研究院院长杨斌曾提议将 Token 的 AI 领域专属中文命名为“模元”,引发广泛讨论,智元、模元、符元等提议层出不穷。

  多方纷争下,国家数据局、人民日报以及中国政府网的此次盖章,意味着正式在官方语境下将大模型基础计量单位“Token”定名为“词元”。

  文章介绍道,词元是大模型处理信息的最小信息单元,具有智能时代可计量、可定价、可交易的特征。当下,围绕词元的调用、分发与结算,一套新的价值体系正在加速演进形成,并成为人工智能产业商业化的重要路径。我国日均词元调用量的大幅增长也表明,随着数据要素市场化配置改革的纵深推进,人工智能高质量数据的供给体系正在形成,“数据供给—价值释放”的良性循环初显。