您好,欢迎访问廊坊市商标专利版权服务平台! 移动应用 微信关注 记账报税 联系客服
一种基于深度卷积和注意力机制的唇语识别方法

本发明公开了一种基于深度卷积和注意力机制的唇语识别方法,包括步骤: S1) 对大型唇读数据集进行预处理,获取唇部识别图像; S2) 将唇部识别图像批量输入到3D 卷积网络模型,进行时空特征提取:S3) 将唇部识别图像提取的时空特征输入卷积和注意力机制的混合网络模型,进行局部和全局的空间特征提取: S4)将提取的空间特征输入到双向门控循环单元,进行长短期特征序列提取: S5)将提取的长短期特征序列输入到多层感知机,获取各个类别的置信度分数: S6) 基于各个类别的置信度分数,经过带有标签平滑机制的交叉损失函数输出识别概率值。本发明在卷积网络的基础上加入注意力机制模型,并改善其结构,提高了唇语识别率并减小了计算开支。

专利名称:一种基于深度卷积和注意力机制的唇语识别方法

专利(申请号):2021108018037

专利类型:发明专利

更新日期:2023/12/14

过期日期:暂无

行业分类:

交易方式:

价格区间:

联系电话:

工作qq:

联系人:

快速申请办理
称呼: *
电话: *
验证码:

订单提交后,10分钟内,我们将安排工作人员和您联系!

浏览排行
记账报税

廊坊市商标专利版权服务平台
联系人:平台客服
热线:400-0670-568
QQ:3239330659
地址:中国 河北 廊坊安次 龙河工业区汇智道85号 裂变客科创服务中心

友情链接: 裂变客网 廊坊市国家高新技术企业认定服务平台
版权所有:廊坊市商标专利版权服务平台 ©2020 www.iprlf.com       备案号:冀ICP备16004371号-4
 
廊坊市商标专利版权服务平台
QQ在线咨询
客服咨询
咨询热线
0316-6161868