人工智能声呐眼镜可识别唇语 准确率约为百分之九十五

2023-04-10 10:39:07 来源:科技日报


(资料图片)

EchoSpeech眼镜。

图片来源:康奈尔大学

美国康奈尔大学研究人员开发了一款声呐眼镜,它通过声学感应和人工智能跟踪嘴唇和嘴巴的动作,可连续识别多达31条无声的命令,该系统可为那些暂时不方便说话或无法发声的人提供帮助。相关论文将在本月于德国汉堡举行的计算机协会计算系统人为因素会议上发表。

这款眼镜是一种名为EchoSpeech的无声语音识别接口。该眼镜配备了一对麦克风和比铅笔橡皮擦还小的扬声器,成为一个可穿戴的人工智能驱动的声呐系统,在面部发送和接收声波,并感知嘴巴的运动。然后,深度学习算法实时分析这些回声轮廓,准确率约为95%。这款低功耗、可穿戴的眼镜只需要几分钟的用户训练数据,即可识别命令并可在智能手机上运行。

EchoSpeech可用于在说话不方便或不合适的地方通过智能手机与他人交流,比如在嘈杂的餐厅或安静的图书馆里。无声语音界面还可与触笔配对,并与CAD等设计软件一起使用,几乎不需要键盘和鼠标。

研究人员表示,他们正在将声呐技术“搬”到人体上。它体积小、功耗低、对隐私敏感,这些都是在现实世界中部署新的可穿戴技术的重要功能。无声语音识别中的大多数技术都局限于一组选定的预定命令,需要用户面部或佩戴摄像头,这既不实用也不可行。可穿戴式摄像头也存在重大的隐私问题,对用户和与之互动的人来说都是如此。而像EchoSpeech这样的声学传感技术消除了对可穿戴式摄像机的需求。

此外,由于音频数据比图像或视频数据小得多,因此EchoSpeech只需更小的带宽,通过蓝牙实时传输到智能手机上,且数据在本地,不在云端,确保了敏感隐私信息安全。

今年以来,人工智能再次引发极大关注。几年前,专家们还在探讨如何让人工智能更加准确地理解人的意图,并与人进行多轮对话。曾经,让人工智能读懂唇语,还只是科幻电影中的桥段。如今,这些都在快速变为现实。面对人工智能带来的超乎预期的变化,不能停留在“看热闹”阶段,人们需要真正去思考,如何更好地主宰人工智能,利用它为人类造福,并尽量规避它可能带来的麻烦。

标签

汤臣倍健2021年市占率10.3% 稳居行业第一

VDS行业发展空间较大、集中度较低。国内膳食营养补充剂(VDS)发展历史尚短,居民的消费意识和习惯尚未完...

2022-05-22 21:06:33

郴州安仁文旅项目集中开工 总投资1000万元

3月16日,安仁县举行文旅项目集中开工活动,县委书记王洪灿在开工仪式上宣布:湘南起义旧址群——朱毛井...

2022-03-20 15:40:46

2022年郴州计划重点推进文旅项目101个 总投资354亿元

3月16日,我市举行全市文旅项目和城市大提质大融城项目集中开工仪式,市委书记吴巨培宣布项目开工。郴州...

2022-03-20 15:39:41

宿州泗县深入推进文旅融合发展 擦亮城市品牌

近年来,泗县以争创安徽省文化旅游名县为目标,深入推进文旅融合发展,努力擦亮水韵泗州 运河名城城市...

2022-03-20 15:38:59

汽车零部件产业“领头羊” 锦州力争一季度“开门红”

3月16日,记者从锦州汽车零部件产业的领头羊——锦州万得集团获悉,今年前两个月,企业订单充足,正铆足...

2022-03-20 15:37:41

油价或有望冲击“九元”大关 宁波新能源汽车市场如何

新一轮国内成品油调价窗口于3月17日24时开启,油价或有望冲击九元大关。前一天晚上11点,鄞州区不少加油...

2022-03-20 15:34:38

从水塘到“云”端 全国最大高邮鸭养殖基地实现智慧养殖

随着新一代数字技术的蓬勃发展,以新兴技术推动现代化新农村建设正成为助力乡村振兴的重要手段。1个人能...

2022-03-20 15:33:17

淡季不忘引流 京郊民宿市场有望迎来回暖

旅游淡季中的京郊民宿有望成为市场中最先复苏的板块。3月17日,北京商报记者调查发现,虽然正值旅游淡季...

2022-03-20 15:32:01

镇江乡村一二三产业融合发展 闯出“镇江之路”

从烹饪江鲜河豚的个体小饭店到规模化的江岛乡村旅游产业集群,从白兔草莓丁庄葡萄的单个农户种植到茅山...

2022-03-20 15:31:11

总投资30亿元 盐城东台8个重大产业项目相继开工

总投资30亿元的精密电子元器件项目、同益电子项目,总投资10亿元的金利美精密组件项目、天永智能设备项...

2022-03-20 15:30:13
x 广告
x 广告

Copyright  2015-2022 华中粮油网版权所有  备案号:京ICP备12018864号-26   联系邮箱:2 913 236 @qq.com