清华杨斌建议将AI核心术语token译“模元” 破解全民普及语言壁垒

🤖 由 文心大模型 生成的文章摘要

AI时代核心术语“token”的中文定名问题迎来新提议。清华大学可持续社会价值研究院院长、经济管理学院教授杨斌近日建议,将“token”统一译为“模元”,以此打破AI技术从专业圈层走向全民普惠的语言障碍,推动人工智能在中国更广泛的普及与应用。

这一提议的提出,恰逢AI产业发展的关键节点。在英伟达2026年GTC大会上,首席执行官黄仁勋的主题演讲中“token”一词累计出现超70次,成为贯穿大会的核心主线。国家数据局最新统计数据显示,截至2025年9月底,我国日均token消耗量已突破40万亿,较2024年初增长400多倍,直观反映出我国人工智能产业的迅猛发展态势。

在杨斌看来,token早已成为AI时代的核心经济标尺,兼具信息单位、算力单位和货币单位三重属性,是AI思考的最小单元,也是算力消耗的核算基准和智能服务的价值度量。而当前这一术语在中文世界缺乏统一、精准的翻译,业界多直接使用英文交流,让普通大众和传统行业从业者产生强烈的距离感与认知隔阂,成为AI全民普及的重要阻碍。

追溯token的发展脉络,其源自古英语,本义为“标志、符号、证明”,核心是“可被识别、承载特定信息或功能的基本单元”。历经中世纪商业代币、网络安全令牌、语言学“词例”的演变,在AI大模型爆发后,token完成了“决定性”跃迁,从语言学碎片化单元升级为AI模型可计算、可处理的最小通用单元,正式取代互联网时代的“字节”,成为AI时代的基础度量衡。

为何选择“模元”作为译名?杨斌详细分析了现有译法的局限性:“词元”被锁死在文本场景,无法适配多模态、物理AI;“语元”囿于语言范畴,窄化了其通用处理单元的本质;“义节”过度聚焦语义,忽略纯特征、结构化处理属性;“托肯”“屯”等音译则徒有其音、缺乏实义,加重非专业人群理解负担。这些译法均无法承载token作为AI产业核心锚点的价值。

“‘模’直指大模型、多模态,锚定AI场景的核心属性;‘元’代表最小基本单元,承续‘字节’这类中文经典度量单位的命名逻辑,简洁直白、通俗易懂。”杨斌表示,“模元”译法具备三大显著优势:对大众友好,无需专业背景即可感知其为AI世界基础计量单位;对产业实用,“模元消耗量”“模元效率”“模元成本”等概念可直接对应AI产业核心指标;对未来兼容,不局限于文本推理,更适配智能体、多模态融合、物理世界AI等全场景。