基于自注意力机制的口语文本顺滑算法  

Disfluency detection with self-attention network

在线阅读下载全文

作  者:吴双志 张冬冬[1] 周明 WU Shuangzhi;ZHANG Dongdong;ZHOU Ming(School of Computer Science and Technology,Harbin Institute of Technology,Harbin 150001,China)

机构地区:[1]哈尔滨工业大学计算机科学与技术学院

出  处:《智能计算机与应用》2019年第6期188-192,共5页Intelligent Computer and Applications

摘  要:口语文本顺滑技术是语音翻译系统中的重要组成部分。其目标是识别并删除语音识别文本中所包含的重复、停顿、修正、冗余等口语现象,进而使口语文本更加书面化,增加文本的可读性和可理解性,有助于提高后续语言处理任务的准确率。本文针对口语文本顺滑问题提出一种基于自注意力机制的识别技术。该技术利用了深度学习中的自注意力神经网络。自注意力神经网络具有很强的序列建模能力,本文首先利用自注意力网络对口语文本进行编码,在此基础之上识别文本中的不流畅因素。在公开数据集上的测试结果表明本文提出的方法可以有效地识别口语中的不流畅因素。Disfluency detection is a very important technique in simultaneously speech translation. It aims at detecting the repetition,redundancy,pauses in the spoken languages to make the text more fluent and readability. In this paper,we propose a self-attention-based detection method. We leverage the self-attention to encode the spoken sentences,based on which disfluent words are detected. We conduct experiments on the public dataset and the results show that our method can effectively detect disfluencies in spoken language.

关 键 词:语音翻译 口语顺滑 神经网络 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象