
近日,北京大学人工智能研究院孙仲研究员团队在国际顶级学术期刊《自然·通讯》(Nature Communications)发表重磅研究成果,成功研制出基于阻变存储器的非负矩阵分解模拟计算求解器。该芯片在网飞规模推荐系统训练任务中,展现出颠覆性性能——计算速度较当前先进数字芯片提升12倍,能效比更是实现超228倍的跨越式提升,为图像分解、个性化推荐等高能效计算场景提供了全新技术方案,标志着我国在模拟计算领域突破关键瓶颈,为后摩尔时代算力革命注入新动能。
在数字经济与人工智能飞速发展的当下,算力需求呈指数级增长,传统数字计算架构正面临双重困境:一方面,冯·诺依曼架构的“内存墙”瓶颈导致数据搬运效率低下,难以支撑大规模并行计算;另一方面,通用数字芯片在处理特定任务时能耗过高,不符合绿色计算的发展趋势。尤其是在个性化推荐、图像分析等依赖非负矩阵分解技术的场景中,传统数字芯片的串行计算模式对海量数据的处理力不从心,成为制约服务实时性与能效的核心瓶颈。
针对这一行业痛点,孙仲团队创新性转向模拟计算赛道,以阻变存储器为核心构建专用计算架构,走出了一条“器件-电路-算法”协同创新的道路。“非负矩阵分解就像一位高效的数据解读者,能从庞杂的用户行为、图像像素信息中提炼潜在特征,但传统数字计算的串行模式让这一过程既耗时又耗能。”孙仲研究员介绍,团队摒弃了通用数字芯片“万能扳手”的设计思路,为非负矩阵分解任务量身打造了高度定制化的“智能钥匙”。
该芯片的核心突破在于基于阻变存储器阵列的模拟电路设计与原创电导补偿技术。阻变存储器具备可调控的电导特性,能够通过物理定律直接实现矩阵运算的并行执行,无需像数字芯片那样进行繁琐的二进制转换与数据搬运。团队通过精巧的电路设计,将核心计算步骤实现“一步求解”,大幅缩减了计算延迟与硬件开销;同时借助原创技术弥补了传统模拟计算精度不足的短板,使芯片在保持与数字芯片相当精度的前提下,实现了能效与速度的双重飞跃。
严苛的实验测试充分验证了该成果的实用价值。在图像分解任务中,该模拟求解器成功实现彩色图像的高质量分解,信噪比损失微乎其微,展现出在计算机视觉领域的应用潜力;而在网飞规模推荐系统训练这一核心场景中,其性能表现尤为亮眼——不仅计算速度较先进数字芯片提升12倍,能显著缩短模型训练周期,更实现了超过228倍的能效比提升。这意味着在完成同等计算任务时,该芯片的能耗仅为传统数字芯片的约1/228,对降低数据中心运营成本、推动绿色算力发展具有重要意义。








