语音分割

作品数:37被引量:120H指数:6
导出分析报告
相关领域:电子电信自动化与计算机技术更多>>
相关作者:张俊星董远王都生石立新夏秀渝更多>>
相关机构:上海交通大学北京声智科技有限公司平安科技(深圳)有限公司吉林大学更多>>
相关期刊:《上海交通大学学报》《福州大学学报(自然科学版)》《科学技术与工程》《计算机工程与应用》更多>>
相关基金:国家自然科学基金国家教育部博士点基金国家高技术研究发展计划云南省哲学社会科学规划项目更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于语音语义引导的语音分割方法
《厦门大学学报(自然科学版)》2024年第6期1042-1050,共9页高盛祥 杨尚龙 余正涛 董凌 周国江 
国家自然科学基金(62376111,U21B2027,61972186);云南高新技术产业发展项目(201606);云南省重大科技专项计划(202303AP140008,202103AA080015,202302AD080003);云南省基础研究计划(202001AS070014);云南省学术和技术带头人后备人才(202105AC160018)。
[目的]语音分割旨在将音频流或者较长的音频分割为短的音频片段,是语音翻译任务中的一个必要步骤.恰当的分割使音频段具有完整的语义,从而使语音翻译模型更关注句子完整的上下文信息,解码得到更优的翻译结果.[方法]本文提出一种基于语...
关键词:语音翻译 语音分割 HuBERT预训练模型 
基于预处理的DOA估计和基频双输入的语音分割
《桂林电子科技大学学报》2024年第4期348-354,共7页王玫 成家礼 
国家自然科学基金(62071135);广西自然科学基金(2019GXNSFBA245103);桂林电子科技大学研究生教育创新计划(2021YCXS037)。
语音分割是语音分离系统的一个重要组成部分,它在信源估计和多说话人环境中的自动语音识别、多声源目标跟踪等许多应用中都起着重要的作用,重叠语音的分割一直都是这项工作的重点。在实际生活中,室内的麦克风采集的语音信号通常都包含...
关键词:语音分割 广义旁瓣相消器 维纳滤波器 波达方向 多假设跟踪 基频 
基于卷积神经网络的实时语音分割优化研究
《电声技术》2024年第5期46-48,共3页杨波 
为进一步提高实时语音分割的性能,分析基于卷积神经网络(Convolutional Neural Networks,CNN)的实时语音分割优化方法。首先,介绍CNN的基本结构和在语音分割中的数学原理。其次,引入修剪技术,根据权重的重要性分数决定保留或删除权重。...
关键词:卷积神经网络(CNN) 语音分割 实时性 修剪技术 
苗语语音音节自适应切分算法
《科学技术与工程》2024年第14期5863-5871,共9页冯夫健 吴磊 谭棉 蔡姗 张学文 王林 
贵州省科技计划(黔科合基础-ZK[2022]一般195,黔科合基础-ZK[2023]一般143,黔科合平台人才-ZCKJ[2021]007,黔科合基础-ZK[2024]一般493);贵州省青年科技人才成长项目(黔教合KY字[2021]104,黔教合KY字[2021]113,黔教合KY字[2021]110);贵州省教育厅自然科学研究项目(黔教技[2023]061号,黔教技[2023]012号,黔教技[2022]015号);贵州省模式识别与智能系统重点实验室开放课题(GZMUKL[2022]KF01)。
语音分割是苗语语音基础研究的难点和热点问题,其本质是苗语语音音节与沉默段(静音、噪音)之间边界模糊问题,目前相关研究成果较少。针对苗语语音音节分割边界模糊问题,以时域特征分割获得初始的语音边界,通过构建语音音节边界优化评价...
关键词:苗语语音分割 时域特征 苗语语音音节 精英策略 自适应 
典型多说话人语音自动分割算法研究
《警察技术》2024年第2期35-38,共4页陆思宇 姜囡 
公安学科基础理论研究创新计划项目(编号:2022XKGJ0110);辽宁省科技厅联合开放基金机器人学国家重点实验室开放基金资助项目(编号:2020-KF-12-11);证据科学教育部重点实验室开放基金资助课题(编号:2021KFKT09);中央高校基本科研业务费专项资金资助(编号:3242019010);辽宁省自然科学基金项目(编号:2019-ZD-0168);教育部重点研究项目(编号:E-AQGABQ20202710)。
针对多说话人涉案语音的检验处理,常需要人工将多说话人语音分为若干个单一说话人语音片段,逐一在长时语音段中寻找语音分割点,从而严重影响检验人员的工作效率。利用说话人语音分割技术可以自动高效寻找出语音段中目标说话人语音转换点...
关键词:说话人语音分割 语音预处理 低信噪比 贝叶斯准则 声纹模型 
基于谱熵法的低信噪比案件语音分割聚类研究
《广东公安科技》2023年第3期23-27,共5页陆思宇 姜囡 
证据科学教育部重点实验室(中国政法大学)开放基金资助课题(2021KFKT09);辽宁省科技厅联合开放基金机器人学国家重点实验室开放基金资助项目(2020-KF-12-11);中国刑事警察学院重大计划培育项目(3242019010);教育部重点研究项目(E-AQGABQ20202710);辽宁省自然科学基金项目(2019-ZD-0168)。
针对常规分割聚类方法在低信噪比语音条件下的局限性,为提高语音分割聚类的准确率,基于谱熵法提出结合贝叶斯信息准则(BIC)和模糊C均值聚类的分割聚类方法,同时在预处理环节引入语音端点检测,可有效降低噪声的影响。通过对谱聚类、双门...
关键词:语音分割聚类 谱熵法 低信噪比 模糊C均值聚类 
基于LSTM的关键词识别系统设计被引量:4
《计算机与网络》2022年第2期64-69,共6页何蕊伽 夏秀渝 
为快速、准确地判断语音流中是否含有关键词,提出一种基于LSTM两步检索的关键词识别系统。将连续语音流分割成独立音节,然后采用过零率直方图进行初步检索,基于过零率直方图的相似度比较的计算量小,可快速排除非关键词。对初检时判断为...
关键词:关键词识别 语音分割 音素识别 循环神经网络 过零率直方图 
基于深度学习的对话重叠语音片段检测被引量:2
《中北大学学报(自然科学版)》2021年第1期34-39,共6页魏金太 高穹 
国家自然科学基金资助项目(11404398);河南科技厅重点攻关项目(142102210097)。
为改进在真实对话中分割重叠语音的自然事件,训练一个深度卷积神经网络(DCNN),使用来自单声道音频的级别相对较低的对数标度梅尔频谱图进行端到端的学习.使用Fisher英语语料库的真实会话数据正确训练DCNN,同时保持并测试其对普通会话场...
关键词:重叠语音 深度卷积神经网络 对话分析 语音分割 类失衡 
快速HAC聚类算法的改进及应用于无监督语音分割被引量:1
《计算机科学与应用》2020年第8期1464-1470,共7页韦占江 梁宇 
HAC是一种常用的聚类方法。本文的目的是根据语音特征中的音素与连续时间的紧密关系,改进HAC快速算法提高无监督分割语音信号到类似音素单位。该算法是基于同一段特征相似度高于跨段特征的相似度。特征的相似度是通过计算相邻特征间的...
关键词:无监督 音素 HAC算法 语音分割 相邻 
基于Python的BIC语音分割算法的实现与应用被引量:3
《计算机与数字工程》2020年第4期763-766,913,共5页王方丽 傅嘉俊 
首先分析了基于贝叶斯信息准则的语音分割原理和算法设计,接着研究了语音多点分割的原理和算法,最后分析了运用语音活性检测对于分割点进行筛选的原理和方法。语音分割算法主要采用Python技术实现,同时,还将该语音分割算法应用到具体实...
关键词:语音信号处理 语音分割 贝叶斯信息准则 语音活性检测 
检索报告 对象比较 聚类工具 使用帮助 返回顶部