国产推理GPU企业曦望完成超10亿元融资估值超百亿成赛道首家独角兽

🤖 由文心大模型生成的文章摘要

国内全栈自研AI推理GPU企业曦望（Sunrise）宣布完成新一轮超10亿元人民币融资，估值突破百亿元，成为国内纯推理GPU赛道首家独角兽企业。

本次融资是2026年AI产业迈入“推理落地、智能体普及”新阶段后，国内GPU领域最大单笔融资之一。曦望自分拆独立仅一年多，已累计完成七轮融资，总融资额约40亿元，资本认可度位居行业前列。

资金将重点投向三大方向：新一代启望S3推理GPU规模化量产与交付、全栈软件生态构建，以及S4、S5后续芯片研发迭代，持续夯实技术与产品竞争力。

曦望自创立便聚焦AI推理赛道。2026年被业内定为“AI智能体元年”，大模型从交互型向具备思考、执行能力的数字员工演进，推理算力需求呈爆发式增长。英伟达GTC2026大会将“每瓦Token吞吐量”定为AI核心竞争力，与曦望战略高度契合。

曦望董事长徐冰指出，AI算力基建重心已全面转向推理，2026年推理计算需求预计达训练需求4-5倍，推理算力租赁价格半年内涨幅近40%。公司已完成三代推理GPU迭代，数万颗芯片量产落地，构建起芯片研发、量产、解决方案交付的完整闭环，所有芯片均实现一次性流片成功且性能达标。

今年1月，曦望发布旗舰产品启望S3推理GPU。该芯片为国内首款搭载LPDDR6且兼容LPDDR5X内存的推理GPU，摒弃高端训练GPU常用的HBM显存路线，针对Agent推理需求重构AI Core计算架构与内存IO系统。

启望S3裁剪训练冗余模块，将晶体管与功耗资源集中于推理场景，单位面积有效算力效率提升5倍以上。大模型推理中，GEMM与Flash Attention算子利用率分别达约99%、98%，推理性能较上一代S2提升5倍，目标实现Token成本下降90%。芯片采用128-bit指令集，支持3D指令与FP16至FP4全链路低精度运算，适配智能体复杂计算需求。

此次融资将加速启望S3规模化落地，助力国产推理GPU突破技术瓶颈、降低算力成本，推动AI智能体产业快速发展，夯实国产AI算力基础设施底座。

国产推理GPU企业曦望完成超10亿元融资估值超百亿成赛道首家独角兽

相关文章

海艺AI正式回归国内市场，模型系统国际受赞誉

中国团队发布新型人工智能代理Manus，声称优于OpenAI模型

Sora iOS应用上线两天下载破16.4万，邀测制下登顶美加App Store前三

工信部宣布加强通用与行业大模型研发，推进AI深度融入制造业

中国已准备好在人工智能大型模型领域参与全球竞争

腾讯云在2025全球数字生态大会上线智能体开发平台3.0

推荐

国家电影局发布6月VR电影备案：25部作品集中落地，红色文化与数字技术深度融合

江苏AI眼镜赋能远程执法应用正式上线，安全生产监管迈入智能化新阶段

Headwolf面向欧洲推出隐私优先AI眼镜，应对高退货率痛点

Retro3D应用发布：将Quest 3变为复古3D眼镜

AI应用推荐

热门

国家电影局发布6月VR电影备案：25部作品集中落地，红色文化与数字技术深度融合

江苏AI眼镜赋能远程执法应用正式上线，安全生产监管迈入智能化新阶段

友情链接

推荐

国家电影局发布6月VR电影备案：25部作品集中落地，红色文化与数字技术深度融合

江苏AI眼镜赋能远程执法应用正式上线，安全生产监管迈入智能化新阶段

Headwolf面向欧洲推出隐私优先AI眼镜，应对高退货率痛点

Retro3D应用发布：将Quest 3变为复古3D眼镜