作者:Ziad Asghar 高通技术公司高级副总裁兼XR业务总经理
这听起来可能有些不可思议,但我刚刚经历了一次最有趣的对话——对话对象竟然是一副由生成式AI赋能的智能眼镜。这不仅仅是一个简单的演示,也让人们得以一窥,高通技术公司正在如何将被视为配件的AI眼镜转变成为独立、全面综合性的终端。
这周二,在全球最大的XR展会AWE USA的舞台上,我通过骁龙技术赋能的雷鸟X3 Pro智能眼镜与AI助手进行了交流。这款设备能够直接在眼镜上完成AI推理,无需依赖云端或互联网连接。
核心理念很简单:AI眼镜将能够独立运行,无需配对智能手机或连接云端。
正如我在AWE期间进行的演示,在不久的将来,用户可以把手机放在口袋里或留在车上,仅需佩戴智能眼镜就能完成超市采购。
在台上时,我模拟了在“超市”购物的场景,请智能眼镜帮助我准备女儿生日派对所需的奶油意面。
搭载小语言模型(SLM)Llama 1B的AI助手理解了我的具体要求,并通过语音和镜片显示的文本,向我提供了所需信息。
这次演示是全球首次完全在一副智能眼镜上运行自回归生成式AI模型。无需手机和云,仅靠眼镜内置处理器完成。
并且,这是在现场观众面前实现的行业里程碑,标志着智能眼镜技术的重大突破。
不仅如此,高通技术公司宣布推出第一代骁龙AR1+处理器,其相较于前代平台尺寸缩小26%,同时增强了图像质量、优化了尺寸、提升了能效,并具备运行小语言模型(SLM)的能力。这四大特性对紧凑型智能眼镜都至关重要。
这些技术成果共同开启了AI智能眼镜的变革,更薄、更轻、更多样化的眼镜设计,同时具备强大的性能,支持AI助手直接在终端侧运行。
尽管这一演示只是智能眼镜终端侧AI功能的冰山一角,但高通技术公司所开展的这项工作将带来的收益是深远且巨大的。
扩展和演进
XR头显和智能眼镜的发展方向将不止于一个路径,因为高通技术公司还提供混合现实处理器,比如同样具有强大终端侧推理能力的第二代骁龙XR2和第二代骁龙XR2+。我预测会有多种不同的终端形态,从足以独立运行AI模型的眼镜设备,到连接手机或附近的小型计算单元(可连接从汽车到平板电脑等一切终端),更轻量化的眼镜设备。高通技术公司的产品组合正在为这一未来做好准备。
无论是云计算、终端侧计算,还是融合两者的混合计算,终端侧AI能力的提升将带来无缝、超低时延、安全的用户体验。这对于AI赋能的智能眼镜进入到任务关键型行业领域至关重要,用户也将更加关注个性化、隐私保护和端到端的智能体体验。
过去一年,我们已看到XR行业取得了显著进展。2024年十二月,高通联合谷歌和三星推出Android XR,这是一款以AI为XR体验核心的操作系统。
行业也在持续扩展,Meta推出Ray-Ban眼镜以及更前沿的硬件Meta Orion,这是Meta首款真正具备自主数字叠加功能的AR眼镜。
此外,我们还看到了来自Rokid、雷鸟和XREAL等公司的眼镜发布。今年三月,BleeqUp推出了一款AI赋能的运动眼镜。
试想一下,凭借第一代骁龙AR1+这样更小巧、更强大的平台,在不牺牲AI模型运行支持的同时,赋能更轻薄的终端形态,这些公司将实现怎样的技术突破。
更智能、更具感知能力
在智能眼镜的发展过程中,合理的尺寸和舒适的佩戴体验至关重要,而与此同时第一代骁龙AR1+还带来了另一项升级——媲美高端智能手机的影像能力,这对智能眼镜的未来演进发展同样至关重要。
能够洞察用户看到的世界的每个细微之处,将为多模态输入开辟全新路径。这种能力对AI至关重要,它不仅能更好地理解用户所见,还能让AI主动提供建议或提供更多物体或位置信息,提升情境感知能力。
智能眼镜将能够独立运行小语言模型,但这并不意味着它们无法与用户身边的众多设备(无论是智能手机,还是PC)协同工作。实际上,我认为智能手表和智能手环或其他可穿戴传感器等新终端将能够与智能眼镜协同交互,并赋能全新输入模态。
在高通技术公司,我们以广泛的终端组合迎接多元化未来,通过创建模块化架构让我们的合作伙伴能够进入空间计算行业,为消费者打造卓越体验。
因此,我认为这次与智能眼镜AI助手的对话演示象征着行业的一次重要转折点,标志着深远行业变革的开启。高通技术公司的创新工作,正逐步释放更深入、更个性化的智能体体验的颠覆性潜力。