bc体育 - bc体育平台

热门关键词:

您的位置: 主页 > 资讯动态 > 调料搭配 >
作为搜狗语音交互补充的唇语识别发展到哪一步了
作者:bc体育平台 来源:bc体育平台 点击: 发布日期: 2021-02-08 00:12
信息摘要:
另外,搜索狗的唇语识别还可以为听力障碍、心理障碍者等服务。综上所述,陈伟回答说,目前搜索狗唇语识别主要应用于两个场景:一是在大多数语言场景下,相机的覆盖率低于麦克风,但通过相机获得的图像数据主要用于监控非常简单和不道德的场景,很难在安全等场景中准确理解图中的人物在说什么,但通过嘴唇识别技术可以通过嘴唇的动作提供大量内容信息。其次,嘴唇识别可以作为辅助技术,提高语音识别技术现阶段的准确性。...
本文摘要:另外,搜索狗的唇语识别还可以为听力障碍、心理障碍者等服务。综上所述,陈伟回答说,目前搜索狗唇语识别主要应用于两个场景:一是在大多数语言场景下,相机的覆盖率低于麦克风,但通过相机获得的图像数据主要用于监控非常简单和不道德的场景,很难在安全等场景中准确理解图中的人物在说什么,但通过嘴唇识别技术可以通过嘴唇的动作提供大量内容信息。其次,嘴唇识别可以作为辅助技术,提高语音识别技术现阶段的准确性。

bc体育

另外,搜索狗的唇语识别还可以为听力障碍、心理障碍者等服务。综上所述,陈伟回答说,目前搜索狗唇语识别主要应用于两个场景:一是在大多数语言场景下,相机的覆盖率低于麦克风,但通过相机获得的图像数据主要用于监控非常简单和不道德的场景,很难在安全等场景中准确理解图中的人物在说什么,但通过嘴唇识别技术可以通过嘴唇的动作提供大量内容信息。其次,嘴唇识别可以作为辅助技术,提高语音识别技术现阶段的准确性。

搜狗唇语识别技术目前对外开放的口语测试水平可超过50%-60%的精度,限定版场景可超过90%。二、发展情况与难题相比,使用传统模型研究唇语识别技术的英国东英吉利大学,搜索犬自由选择使用深度自学的方式,主要包括:一、使用了多少数据二、算法复杂度有多低储藏能力有多强三、场景有多强第一,陈伟回答说,语音对话精度低的问题还没有解决。

相当大的原因是语音噪音问题无法解决问题,再次加入到安静的场景中,精度可以提高到97%的高度。与近场的语音问答过程相同,但这种理想状态很难构筑。为了解决问题,陈伟明确提出了两种方法:一种是通过硬件方式,例如团队实现的麦克风阵列,通过加强语音信号,切断噪音,提高语音识别的精度。

其次,绕过噪音,可动性地添加多模式信息,即唇语识别加上视觉信息,现在的人工智能多是机器模仿人,但弱的人工智能很难打破人类。也就是说,只看嘴唇的动作,不是非常明显的特征,而是依赖上下语言的信息。另外,陈伟对普通话有4个调整,但英语没有征集。

bc体育

英语的基本发音单元在50个左右,中文如何缝合声韵母,详细建模至少在200个左右,发音单元之间有很大差异。仅次于的难题是一般化能力的训练。

bc体育平台

陈伟以谷歌为例,谷歌的一般化是基于2010年至2016年新闻采访训练集整体的数据,在开集训练中确保精度高。例如,搜索犬早期对新闻广播主持人的一般训练,其精度平均在70%以上。陈伟回答说,在对外开放口语测试水平的基础上,基本上可以确保50%-60%的正确率,但在横向场景下,声音相对收敛过多,正确率可以比较提高。

例如,在车载和智能家庭场景下。关于唇语识别是否与用户隐私安全性无关,陈伟回答说,目前技术发展状态还没到这个阶段,搜索犬正在探索唇语识别与什么样的明确需要融合场景。原始文章允许禁止发布。

下一篇文章发表了注意事项。


本文关键词:作为,搜狗,语音,交互,补充,的,唇语,识别,发,bc体育平台

本文来源:bc体育-www.greatbuyprices.com

全国服务热线

0431-75207405