唇语识别

作品数:47被引量:57H指数:5
导出分析报告
相关领域:自动化与计算机技术电子电信更多>>
相关作者:张洪博杜吉祥刘爱萍刘丽岳振军更多>>
相关机构:北方工业大学平安科技(深圳)有限公司浙江大学合肥工业大学更多>>
相关期刊:《计算机应用研究》《国外科技动态》《软件学报》《电子器件》更多>>
相关基金:国家自然科学基金中国科学院战略性先导科技专项中央高校基本科研业务费专项资金宁夏回族自治区自然科学基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于MXene/PEDOT:PSS柔性压力传感器的制备及其在唇语识别中的应用
《复合材料学报》2025年第1期374-385,共12页钟山 贾磊 李晓春 张校亮 孟雪娟 
山西省应用基础研究青年基金(202203021212265);山西省医学重点科研项目(2022XM17)。
唇语是声带损伤、喉舌损伤及听障患者的一种有效的语言沟通方式。唇语信号由嘴唇和面部肌肉运动而产生,其包含了大量的语音信息。通过柔性压力传感器来捕获肌肉运动可实现唇语信号的提取和识别,为听、说功能障碍患者提供了更加自然、便...
关键词:柔性可穿戴电子设备 唇语 柔性压力传感器 MXene PEDOT:PSS 卷积神经网络 
解耦同类自知识蒸馏的轻量化唇语识别方法被引量:1
《北京航空航天大学学报》2024年第12期3709-3719,共11页马金林 刘宇灏 马自萍 郭兆伟 吕鑫 
宁夏自然科学基金(2022AAC03268);北方民族大学中央高校基本科研业务费专项资金(2021KJCX09,FWNX21);北方民族大学“计算机视觉与虚拟现实”创新团队项目。
针对唇语识别模型因参数量和计算量较大而无法在移动终端和边缘设备上应用的问题,提出基于解耦同类自知识蒸馏和GhostNet-TSM的唇语识别方法。提出具有时序特征提取能力的GhostNet-TSM网络;将同类自知识蒸馏的特征解耦为目标类特征和非...
关键词:唇语识别 知识蒸馏 轻量化 GhostNet TSM模块 
Partition-Time Masking:一种唇语识别数据增强方法
《计算机科学》2024年第S02期473-478,共6页胡宇 殷继彬 
提出了一种唇语识别数据增强方法Partition-Time Masking。该方法直接作用于输入数据,通过将输入划分为多个子序列再分别进行Mask操作最后再将各子序列按序拼接,使得模型能对部分帧缺失的输入具有更强的鲁棒性,从而增强泛化能力。实验...
关键词:唇语识别 Time Making 数据增强 视觉语音识别 DC-TCN 
微运动激励与时间感知的唇语识别方法
《电子学报》2024年第11期3657-3668,共12页马金林 吕鑫 马自萍 郭兆伟 吕科 
宁夏自然科学基金(No.2023AAC03264);北方民族大学中央高校基本科研业务费专项(No.2021KJCX09)。
时序信息和唇部细微变化对唇语识别至关重要.然而,现有唇语识别方法不能精准捕获时序信息和关注细微运动.为此,提出一种关注微小唇部变化和增强时序信息的唇语识别方法DMT-GhostNet.首先,引入解藕时空增强块(Decoupled Spatio-Temporal ...
关键词:唇语识别 GhostNetV2 时间维度 微运动激励 
基于多尺度时空卷积的唇语识别方法
《电子与信息学报》2024年第11期4170-4177,共8页叶鸿 危劲松 贾兆红 郑辉 梁栋 唐俊 
国家自然科学基金(71971002,62273001);安徽省自然科学基金(2108085QA35);安徽省重点研究与开发计划(202004a07020050);安徽省科技重大专项(202003A06020016);安徽省高校优秀科研创新团队(2022AH010005)。
现有的唇语识别模型大多采用将单层的3维卷积与2维卷积神经网络结合的方式,从唇语视频序列中挖掘出时空联合特征。然而,由于单层的3维卷积不能很好地提取时间信息,同时2维卷积神经网络对细粒度的唇语特征的挖掘能力有限,该文提出一种多...
关键词:唇语识别 多尺度时空卷积网络 Res2Net 时空坐标注意力 数据增强 
基于深度学习的音视频语音识别技术回顾与展望被引量:1
《人工智能》2024年第3期57-66,共10页张景宣 万根顺 
中央高校基本科研业务费专项资金资助(GK202406005)。
音视频语音识别旨在基于语音以及对应唇形视频输入识别语音的文本内容信息。音视频语音识别技术在噪声场景下可以有效地提升语音识别的准确率,因而其具有广泛的应用前景。本文聚焦深度学习框架下的音视频语音识别技术,总结音视频语音识...
关键词:语音识别 音视频语音识别 唇语识别 音视频自监督学习 
基于Transformer-LSTM的闽南语唇语识别
《泉州师范学院学报》2024年第2期10-17,共8页曾蔚 罗仙仙 王鸿伟 
福建省教育厅中青年教师教育科研项目(JAT200542)。
针对端到端句子级闽南语唇语识别的问题,提出一种基于Transformer和长短时记忆网络(LSTM)的编解码模型.编码器采用时空卷积神经网络及Transformer编码器用于提取唇读序列时空特征,解码器采用长短时记忆网络并结合交叉注意力机制用于文...
关键词:唇语识别 闽南语 TRANSFORMER 长短时记忆网络(LSTM) 用时空卷积神经网络 注意力机制 端到端模型 
基于多重视觉注意力的唇语识别
《模式识别与人工智能》2024年第1期73-84,共12页谢胤岑 薛峰 曹明伟 
国家自然科学基金项目(No.62272143);安徽省重大科技专项项目(No.202203a05020025);安徽高校协同创新项目(No.GXXT-2022-054);安徽省第七届创新创业人才特殊支持计划资助。
唇语识别是将单个说话人嘴唇运动的无声视频翻译成文字的一种技术.由于嘴唇运动幅度较小,现有唇语识别方法的特征区分能力和泛化能力都较差.针对该问题,文中分别从时间、空间和通道三个维度研究唇语视觉特征的提纯问题,提出基于多重视...
关键词:唇语识别 视觉语音识别 注意力机制 深度神经网络 特征提取 
基于标注人脸轮廓的唇语识别方法
《信息技术与信息化》2023年第11期199-203,共5页宁佐金 蒋近 彭思齐 
湖南省自然科学基金(2021JJ30671);顺德区重点科技项目(2130218002544)。
唇读是一项古老的技术,在很早之前聋哑人为解决与人交流的问题时便出现了。如今计算机已经能够实现简单的唇语识别,然而其识别效果与鲁棒性却不甚理想。为了解决这些问题,提出了基于标注人脸轮廓的唇语识别方法,所提出的方法设计了一个...
关键词:唇语识别 人脸识别 鲁棒性 
HSKDLR:同类自知识蒸馏的轻量化唇语识别方法被引量:2
《计算机科学与探索》2023年第11期2689-2702,共14页马金林 刘宇灏 马自萍 巩元文 朱艳彬 
宁夏自然科学基金(2022AAC03268,2020AAC3215);北方民族大学中央高校基本科研业务费专项(2021KJCX09,FWNX21);北方民族大学“计算机视觉与虚拟现实”创新团队项目。
针对唇语识别模型的识别率较低和计算量较大的问题,提出一种同类自知识蒸馏的轻量化唇语识别模型(HSKDLR)。首先,提出关注唇部图像空间特征的S-SE注意力模块,用其构建提取唇部图像通道特征和空间特征的i-Ghost Bottleneck模块,以提升唇...
关键词:唇语识别 轻量化 知识蒸馏 自知识 Ghost Bottleneck 
检索报告 对象比较 聚类工具 使用帮助 返回顶部