检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:吴双志 张冬冬[1] 周明 WU Shuangzhi;ZHANG Dongdong;ZHOU Ming(School of Computer Science and Technology,Harbin Institute of Technology,Harbin 150001,China)
机构地区:[1]哈尔滨工业大学计算机科学与技术学院
出 处:《智能计算机与应用》2019年第6期188-192,共5页Intelligent Computer and Applications
摘 要:口语文本顺滑技术是语音翻译系统中的重要组成部分。其目标是识别并删除语音识别文本中所包含的重复、停顿、修正、冗余等口语现象,进而使口语文本更加书面化,增加文本的可读性和可理解性,有助于提高后续语言处理任务的准确率。本文针对口语文本顺滑问题提出一种基于自注意力机制的识别技术。该技术利用了深度学习中的自注意力神经网络。自注意力神经网络具有很强的序列建模能力,本文首先利用自注意力网络对口语文本进行编码,在此基础之上识别文本中的不流畅因素。在公开数据集上的测试结果表明本文提出的方法可以有效地识别口语中的不流畅因素。Disfluency detection is a very important technique in simultaneously speech translation. It aims at detecting the repetition,redundancy,pauses in the spoken languages to make the text more fluent and readability. In this paper,we propose a self-attention-based detection method. We leverage the self-attention to encode the spoken sentences,based on which disfluent words are detected. We conduct experiments on the public dataset and the results show that our method can effectively detect disfluencies in spoken language.
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.145