
国内全栈自研AI推理GPU企业曦望(Sunrise)宣布完成新一轮超10亿元人民币融资,估值突破百亿元,成为国内纯推理GPU赛道首家独角兽企业。
本次融资是2026年AI产业迈入“推理落地、智能体普及”新阶段后,国内GPU领域最大单笔融资之一。曦望自分拆独立仅一年多,已累计完成七轮融资,总融资额约40亿元,资本认可度位居行业前列。
资金将重点投向三大方向:新一代启望S3推理GPU规模化量产与交付、全栈软件生态构建,以及S4、S5后续芯片研发迭代,持续夯实技术与产品竞争力。
曦望自创立便聚焦AI推理赛道。2026年被业内定为“AI智能体元年”,大模型从交互型向具备思考、执行能力的数字员工演进,推理算力需求呈爆发式增长。英伟达GTC2026大会将“每瓦Token吞吐量”定为AI核心竞争力,与曦望战略高度契合。
曦望董事长徐冰指出,AI算力基建重心已全面转向推理,2026年推理计算需求预计达训练需求4-5倍,推理算力租赁价格半年内涨幅近40%。公司已完成三代推理GPU迭代,数万颗芯片量产落地,构建起芯片研发、量产、解决方案交付的完整闭环,所有芯片均实现一次性流片成功且性能达标。
今年1月,曦望发布旗舰产品启望S3推理GPU。该芯片为国内首款搭载LPDDR6且兼容LPDDR5X内存的推理GPU,摒弃高端训练GPU常用的HBM显存路线,针对Agent推理需求重构AI Core计算架构与内存IO系统。
启望S3裁剪训练冗余模块,将晶体管与功耗资源集中于推理场景,单位面积有效算力效率提升5倍以上。大模型推理中,GEMM与Flash Attention算子利用率分别达约99%、98%,推理性能较上一代S2提升5倍,目标实现Token成本下降90%。芯片采用128-bit指令集,支持3D指令与FP16至FP4全链路低精度运算,适配智能体复杂计算需求。
此次融资将加速启望S3规模化落地,助力国产推理GPU突破技术瓶颈、降低算力成本,推动AI智能体产业快速发展,夯实国产AI算力基础设施底座。








