
据报道,苹果公司已以16亿美元的价格完成对初创企业Q.ai的收购,该公司专注于研发“无声语音”转文本技术,此项技术对于增强现实(AR)眼镜的研发与应用具有至关重要的意义。
若路透社等主流媒体广泛报道的16亿美元估值信息属实,那么该笔交易将成为苹果公司迄今为止规模第二大的收购案,仅次于其对Beats公司的收购。
Q.ai自2022年成立以来,始终采取“隐秘运营模式”,对其核心研发内容实施严格保密措施。不过,该公司三位联合创始人的从业背景,以及其公开的专利申请文件中披露的细节,为外界了解这项“无声语音”技术提供了重要线索。
Q.ai首席执行官阿维亚德·迈泽尔斯(Aviad Maizels)曾创办PrimeSense公司,该公司于2013年被苹果收购,其核心技术为苹果Face ID功能的研发提供了重要支撑。此外,PrimeSense公司还曾将部分技术授权给微软,应用于初代Kinect设备。该公司首席技术官约纳坦·韦克斯勒(Yonatan Wexler)博士是世界级计算机视觉领域专家,曾担任OrCam公司研发副总裁,该公司的核心业务是将高端计算机视觉技术实现微型化,并集成至可夹装于眼镜的小型设备中。
“无声语音”技术的核心概念,是通过感知用户发音时面部肌肉的细微动作,实现无声状态下的文本口述。借助此项技术,用户可在公共场合实现敏感信息的完全私密发送,亦可在不被周围人员察觉的情况下,向人工智能助手下达相关指令。
从技术理念来看,“无声语音”相关研发并非全新领域,另一家初创企业Alterego正致力于采用基于硬件的技术路径,通过在用户下巴处连接传感器的方式实现相关功能。
结合Q.ai公开的专利文件推测,该公司的技术优势在于采用计算机视觉方案,通过摄像头对准用户下巴进行感知,而非将传感设备固定于下巴部位。
以其“无声语音检测”相关专利为例,该专利描述了一种位于“用户面部附近”的“光学传感头”,该传感头可“感应从用户面部反射的光线,并根据检测到的光线信号输出对应数据”,进而实现无声语音的识别与转换。
业内推测,苹果公司大概率会将Q.ai的“无声语音”技术,整合至其未来推出的Apple Vision头戴式设备、AirPods耳机柄,以及彭博社记者马克·古尔曼(Mark Gurman)与供应链分析师郭明錤此前披露的、苹果正处于研发阶段的智能眼镜产品中。
值得注意的是,Meta公司在同类领域采取了不同的技术布局,该公司正致力于研发通过用户在腿部等身体表面涂鸦字母,并借助佩戴于手腕的sEMG腕带进行信号感应,从而实现私密输入的相关技术。
无论上述哪种技术路径最终成为市场主流,对于智能眼镜而言,若想实现对智能手机的替代,具备在公共场合佩戴时的私密文本输入功能,都将是不可或缺的核心竞争力之一。








