近日,在央视颇具影响力的《赢在AI+》节目中,智音无碍科技创始人凌志鹏带来了一项令人瞩目的AR眼镜新“玩法”,吸引了众多目光,为听障人士的沟通难题提供了创新性的解决方案。
凌志鹏团队精心研发的知音AR眼镜,集成了先进的语音识别与反向手语识别技术,犹如一座跨越无声与有声世界的桥梁,为听障人士与健听人之间的顺畅交流带来了曙光。当听障人士打手语时,眼镜能够迅速捕捉手部动作,通过内置的智能算法和强大的AI大模型,将手语实时翻译成语音,清晰地传达给健听人,让他们能够理解听障人士想要表达的意思;而当健听人说话时,眼镜的语音识别功能即刻启动,把声音转化为文字,直观地显示在镜片上,帮助听障人士获取信息,从而实现了双方之间双向、多轮的复杂沟通,极大地提升了交流的效率和质量。
为了让知音AR眼镜达到如此出色的性能,智音无碍科技团队付出了巨大的努力。他们不辞辛劳,进行了上千次的手语数据采集工作,深入到听障群体中,记录各种场景下的手语表达,涵盖了日常生活、工作交流、社交互动等多个方面,积累了海量且丰富的数据资源。同时,经过无数次的大模型训练,不断优化算法,调整参数,让AI模型对手语和语音的理解与转换能力日益精准,最终从零构建出了知音聋哑人AI无障碍系统,并配套研发出了这款具有划时代意义的知音AR眼镜。
这款眼镜搭载的语音识别功能,在具备市面上常见语音识别能力的基础上,还实现了功能升级,新增了提示词敏感词识别与声源定位功能。想象一下,当有人呼叫听障人士姓名时,佩戴的眼镜会敏锐地捕捉到这一关键信息,突出显示敏感点,同时利用四个精心布局的麦克风进行声场测试,如同拥有了“顺风耳”一般,能够精准判断声源位置,甚至还能进一步识别音色特征,分辨出呼叫者是男是女、年长还是年幼等,为听障人士提供更全面的声音信息。此外,对于汽车鸣笛、鸟叫、流水等各类生活中常见的声音,产品也别出心裁地用特定小符号代表其含义并显示在眼镜上,让听障人士能够“看见”声音,感知周围丰富的环境音,更好地融入生活场景。
而反向手语识别技术更是这款产品的一大突破性亮点。眼镜上配备的广角摄像头,犹如一双智能的眼睛,能够高效捕捉听障人士前方95度左右的手语动作,将这些动作信息迅速传输给AI大模型。AI大模型在接收到信息后,凭借强大的运算和推断能力,快速理解手语所表达的语义,并将其精准翻译成语音输出。这一技术填补了国内相关领域的技术空白,为听障人士与健听人之间的交流提供了前所未有的便利,让双方能够更加自然、流畅地进行沟通,极大地改善了听障人士的社交体验。