唇语识别
搜索文档
可识别唇语,苹果的新专利可能会解救头戴设备
36氪· 2025-12-01 02:18
苹果公司新专利技术 - 公司获批一项新专利,未来头戴式设备将支持通过视觉传感器读取唇语,实现无声语音输入 [1] - 该技术旨在解决用户在无法或不愿说话的佩戴场景下的交互问题 [3] - 该无声输入模式有望成为解决公共场合使用痛点的两全其美方案 [10] AI/XR头戴设备行业现状与挑战 - 行业正迎来热潮,小米和阿里等公司已相继进入市场 [3] - 但产品面临高退货率挑战,在抖音电商平台上AI眼镜的平均退货率达到40%-50% [3] - 产品被用户列为“吃灰神器”,主要痛点包括元器件增多导致的佩戴负担以及语音交互问题 [3] 语音交互的核心痛点 - 在公共场合使用语音交互会使用户产生“羞耻感”或社交压力 [6] - 公共场合环境音复杂,用户需提高音量以确保指令被识别,这与公序良俗相悖且暴露隐私 [6] - 语音交互的信息量大,需要用户耗费更多精力进行分析和筛选,对人脑的上下文联想不友好 [8] - 马化腾曾指出语音交互在公共场合使用显得“好傻”、不好意思且不私密 [6] 现有交互方案的局限性 - 语音交互是当前最具性价比的解决方案,但要求用户必须发出声音 [8] - 若强化语音识别、自然语义处理、远场拾音等技术以捕捉低声语音,成本将大幅提升,导致潜在受众减少 [8] - 此前主要的镜腿触控交互不符合人体工学,频繁举手操作易导致疲劳 [10] - TWS耳机的触控交互可行是因为其为低频操作场景,不适用于需要频繁交互的头戴设备 [10] 唇语识别技术的潜力与影响 - 识别唇语技术可通过向AI模型灌输不同语言用户的唇部动作数据进行预训练来实现 [12] - 该技术只需搭配成熟的AI视觉模型,并非“黑科技” [10] - 解决识别率问题后,有望搬开阻碍AI眼镜、XR头显在公共场合广泛使用的最大绊脚石 [12] - 一旦用户能毫无顾忌地使用,此类产品将有机会从小众尝鲜产品转变为大众化消费电子产品 [14]