康奈尔大学的研究人员开发了一种声纳眼镜,通过声学感应和人工智能跟踪嘴唇和嘴巴的动作,可以连续识别多达31个无声命令,可以帮助那些暂时不方便说话或不能说话的人。相关论文将在本月在德国汉堡举行的计算机协会计算系统人为因素会议上发表。
这种眼镜是一种无声的语音识别接口,叫做Echospech。该眼镜配备了一对麦克风和一个比铅笔橡皮擦更小的扬声器,成为一个可穿戴的人工智能驱动声纳系统,在面部发送和接收声波,并感知口腔的运动。然后,深度学习算法实时分析这些回声轮廓,准确率约为95%。这款低功耗、可穿戴的眼镜只需要几分钟的用户训练数据就可以识别命令并在智能手机上运行。
Echospech可以用来通过智能手机与他人交流,比如在嘈杂的餐厅或安静的图书馆。无声语音界面也可以与触笔匹配,并与CAD和其他设计软件一起使用,几乎不需要键盘和鼠标。
研究人员说,他们正在向人体“移动”声纳技术。它体积小、功耗低、对隐私敏感,是现实世界中部署新可穿戴技术的重要功能。无声语音识别中的大多数技术仅限于一组选定的预订命令,需要用户面对或佩戴相机,既不实用也不可行。可穿戴相机也存在重大隐私问题,对用户和与之互动的人来说都是如此。像Echospech这样的声学传感技术消除了对可穿戴相机的需求。
此外,由于音频数据远小于图像或视频数据,Echospech只需要更小的带宽,通过蓝牙实时传输到智能手机,数据在本地,而不是云,以确保敏感隐私信息的安全。
总编辑圈点
自今年年初以来,人工智能再次引起了极大的关注。几年前,专家们还在讨论如何让人工智能更准确地理解人们的意图,并与人们进行多轮对话。曾经,让人工智能理解唇语只是科幻电影中的一个桥梁。现在,这些都在迅速成为现实。面对人工智能带来的意想不到的变化,人们需要真正思考如何更好地控制人工智能,利用它造福人类,并尽量避免它可能带来的麻烦。
消费界所刊载信息,来源于网络,并不代表本媒体观点。本文所涉及的信息、数据和分析均来自公开渠道,如有任何不实之处、涉及版权问题,请发送邮件:Jubao_404@163.com,我们会及时处理。本文仅供读者参考,任何人不得将本文用于非法用途,由此产生的法律后果由使用者自负。投诉举报邮箱:
未经书面授权不得复制或建立镜像,违者必究。
Copyright © 2012 -2023 CONSUMER TIMES. All Rights Reserved.
深圳市赢销网络科技有限公司版权所有
粤ICP备14076428号粤公网安备 44030702005336号