
2025年11月18日,蚂蚁集团正式宣布推出全模态通用AI助手“灵光”,该产品已同步登陆安卓与苹果两大移动应用商店,凭借“全代码生成多模态内容”的突破性技术,为用户带来从信息交互到生产力工具创作的全新体验。作为业内首个实现这一技术突破的AI助手,“灵光”的上线不仅完善了蚂蚁集团在通用人工智能领域的布局,更在多模态AI赛道掀起新的行业变革。
“灵光”的核心竞争力体现在其首创的全代码生成能力与三大核心功能的协同落地。不同于传统AI助手以文字输出为主的交互模式,“灵光”支持3D模型、音视频、动态图表、可交互地图等全模态信息输出,所有呈现内容均由模型根据对话情境即时生成代码并渲染,而非依赖预设模板。这种技术特性让“灵光对话”功能突破了传统问答的局限,以“信息策展”的思路重构对话体验——当用户查询复杂知识时,系统不仅能通过结构化思维梳理出逻辑清晰的核心内容,还能同步生成可视化组件辅助理解。例如用户询问“太阳系行星运行规律”,“灵光”会在输出文字解析的同时,生成动态3D太阳系模型,支持用户拖动星球查看运行轨迹与参数,让抽象知识“秒懂”。
最受普通用户关注的“灵光闪应用”功能,更是将AI的生产力价值推向新高度。用户只需通过自然语言描述需求,最快30秒、最长1分钟即可生成一款具备完整交互能力的小应用,且支持参数自定义、功能迭代与社交分享。新京报记者实测发现,输入“制作一个支持倒计时的计时器”后,“灵光”在数十秒内便完成应用开发,不仅设计了简洁的交互UI,还主动询问是否需要增加历史记录等延展功能,用户确认后可快速完成功能升级。这一功能已覆盖生活多个场景:询问“溏心蛋煮制方法”时,会生成包含鸡蛋大小、熟度偏好等参数的“溏心蛋时间计算器”;关注养车成本时,可自定义里程、油费标准的计算器能实时生成个性化养车方案;健身爱好者则能通过一句“设计适合上班族的碎片化健身计划”,获得可调整运动时长、强度的专属工具。值得注意的是,这些“闪应用”并非静态页面,而是能调用大模型后端能力实现实时交互,显著拓宽了应用场景边界。
“灵光开眼”功能则通过AGI相机技术实现了虚拟信息与物理世界的无缝融合。用户用手机摄像头对准现实场景,系统即可通过实时视频流解析进行识别与交互:在旅游场景中对准古建筑,能即时讲解其历史背景与建筑特色;在购物时扫描商品条形码,可快速生成价格对比图表与用户评价摘要;创作场景下,支持文生图、图生图、视频生成等多种模式,拍摄风景后输入“将这片晚霞改成梵高画风”,便能即时获得艺术化处理的作品。










