关键词检测

作品数:46被引量:52H指数:4
导出分析报告
相关领域:自动化与计算机技术电子电信更多>>
相关作者:颜永红张鹏远徐波贺前华张连海更多>>
相关机构:中国科学院自动化研究所深圳市腾讯计算机系统有限公司解放军信息工程大学清华大学更多>>
相关期刊:《计算机工程与设计》《清华大学学报(自然科学版)》《智能计算机与应用》《信息工程大学学报》更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划内蒙古自治区自然科学基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于CLIP的多模态融合视频描述生成
《计算机工程与设计》2025年第2期384-391,共8页王亮 夏舟勇 胡营营 王军 
国家外国专家项目计划基金项目(G2022006008L);中国高校产学研创新基金项目(2021LD06009);辽宁省自然科学基金项目(2022-MS-291);辽宁省教育厅科研基金项目(LJ2020024);辽宁省教育厅基本科研基金项目(LJKMZ20220781);辽宁省教育厅基本科研面上基金项目(JYTMS20231488)。
为解决视频描述任务中2D的CLIP预训练模型缺乏时序关系与动作检测敏感性以及信息冗余问题,提出一种基于CLIP的结合注意力掩码与运动表示增强的多模态融合视频描述模型。采用可学习令牌整理冻结的CLIP特征、运动特征与音频特征中的关键信...
关键词:预训练模型 视频描述 多模态 特征融合 运动表示 注意力掩码 关键词检测 
基于有限训练数据和开放集学习的鲁棒小型关键词检测系统
《清华大学学报(自然科学版)》2024年第11期1927-1935,共9页黄子峻 张晓雷 
国家自然科学基金面上项目(62176211);深圳市科创委国际合作研究项目(GJHZ20240218114401004)。
关键词检测旨在从语音中检测出待识别的关键词,深度神经网络为小型关键词检测任务提供了有效的解决方案。大多数现有关键词检测方法采用Softmax最小化交叉熵损失函数,假设测试和训练样本来自相同分布,侧重于在训练集上最大化分类精度,...
关键词:有限训练数据 关键词检测 开放集识别 原型学习 
基于多尺度距离矩阵的语音关键词检测与细粒度定位方法
《计算机应用研究》2024年第11期3370-3375,共6页李祥瑞 毛启容 
江苏省重点研发计划资助项目(BE2020036);江苏大学应急管理学院专项科研项目(KY-A-01)。
针对现有语音关键词检测方法定位精度低的问题,提出了一种基于多尺度距离矩阵的语音关键词检测与细粒度定位方法(spoken term detection and fine-grained localization method based on multi-scale distance matrices,MF-STD)。该方...
关键词:语音关键词检测 语音细粒度定位 多尺度检测 残差卷积网络 
基于样本类不确定性抽样的端到端语音关键词检测训练方法
《电子学报》2024年第10期3482-3492,共11页贺前华 陈永强 郑若伟 黄金鑫 
广东省科技计划项目(No.2023A0505050116,No.2022A1515011687);国家自然科学基金(No.62371195)。
当前语音关键词检测主流技术为端到端的深度学习方法,研究重点为网络结构优化、建模单元选取及搜索策略等,并取得较快进展,但对模型训练效率的关注相对较少.本文针对深度学习模型训练效率问题,提出了一种样本类不确定性抽样(Class Uncer...
关键词:检测 深度学习 端到端 类不确定性抽样 
基于深度神经网络的藏语语音关键词检索方法
《西藏科技》2024年第6期73-80,共8页张恒 拉巴顿珠 官政先 肖鑫 
2022年西藏大学大学生创新性实验训练计划项目(2022XCX085)。
语音关键词识别作为人机语音交互的一项基础性研究课题,其目的是从连续的语音信号中提取特定的关键词,并实现对目标设备的唤醒以及其他相关功能。文章提出了一种基于DNN-HMM声学模型的藏语卫藏方言关键词检测方法。首先,通过切割、转换...
关键词:声学模型 藏语 深度学习 关键词检测 语音识别 
基于双向长短时记忆和卷积Transformer的声学词嵌入模型被引量:1
《计算机应用》2024年第1期123-128,共6页高芸芸 赵腊生 张强 
辽宁省教育厅基本科研项目(LJKMZ20221838)。
示例查询语音关键词检测中,卷积神经网络(CNN)或者循环神经网络(RNN)提取到的声学词嵌入语音信息有限,为更好地表示语音内容以及改善模型的性能,提出一种基于双向长短时记忆(Bi-LSTM)和卷积Transformer的声学词嵌入模型。首先,使用Bi-L...
关键词:卷积神经网络 声学词嵌入 语音信息 示例查询语音关键词检测 循环神经网络 
基于多粒度对比学习的聊天对话摘要模型被引量:1
《计算机科学》2023年第11期192-200,共9页康梦瑶 刘扬 黄俊恒 王佰玲 刘树龙 
国家重点研发计划(2020YFB2009502);国家自然科学基金(62272129);中央高校基本科研业务费专项资金(HIT.NSRIF.2020098)。
社交网络的发展在给人们带来便捷的同时也产生了海量的聊天数据,如何从聊天对话中筛选出关键信息成为一大难题。聊天摘要是解决此类问题的有效工具,既不必重复浏览冗长的聊天记录,又可以快速获取重要内容。目前,预训练模型被广泛应用于...
关键词:聊天摘要 对比学习 预训练模型 关键词检测 主题分割 
基于特征空间轨迹信息的语音关键词检测方法被引量:1
《电子学报》2023年第10期2915-2924,共10页田颖慧 贺前华 郑若伟 危卓 李艳雄 
广东省自然科学基金(No.2022A1515011687);国家自然科学基金(No.61571192)。
当前语音关键词检测的主流技术为深度学习,需要大规模标注样本进行训练,难以应用于更普遍的低资源场景.本文提出一种基于音频特征空间轨迹信息的低资源语音关键词检测方法,该方法基于“词是由更小语言单元(音节、音素)的结构化组成,以...
关键词:语音关键词检测 音频特征空间 特征空间轨迹信息 低资源 
融合媒体新闻关键词检测系统设计与实现被引量:2
《现代电视技术》2021年第6期135-137,101,共4页丁鑫锋 
本文介绍了上海广播电视台在融合媒体制播云平台下,新闻制作流程中的关键词检测系统的应用实践。该系统在内容资源协调制作中对电视新闻制播、新媒体发布流程中涉及的文字进行自动校对,保证新闻用语的准确性和规范性。
关键词:新闻关键词检测 自然语言学习 
融合媒体新闻关键词检测系统设计与实现
《电视工程》2021年第1期12-14,共3页丁鑫锋 
一、系统实施的背景1、行业现状在当前全媒体的环境下,信息资讯传播速度飞速增长。媒体生产一条新闻,为了跨大它的传播性通常需要一稿多发,多平台推送,新闻不仅仅在电视端播出,还需要在自有APP、微信微博、今日头条、抖音等同步推送。...
关键词:制作手法 今日头条 信息资讯 传播速度 一稿多发 融合媒体 发布渠道 传播性 
检索报告 对象比较 聚类工具 使用帮助 返回顶部