2015年中国少数民族地区蒙藏维言语录音数据集  被引量:2

Mongolian,Tibetan,and Uyghur speech data from Chinese minority regions in 2015

在线阅读下载全文

作  者:韦向峰[1] 袁毅[1] 张全[1] 池哲洁[1,2] Wei Xiangfeng;Yuan Yi;Zhang Quan;Chi Zhejie

机构地区:[1]中国科学院声学研究所,北京100190 [2]中国科学院大学,北京100049

出  处:《中国科学数据(中英文网络版)》2016年第2期62-68,共7页China Scientific Data

基  金:中国科学院信息化专项科技数据资源整合与共享工程重点数据库项目之“民族信息处理学科领域基础科学数据整合与集成应用”

摘  要:本文介绍了2015年采集的来自内蒙古、青海、西藏和新疆的蒙古语、藏语和维吾尔语言语数据集,使用客户端/服务器架构的言语数据远程采集系统,实现了蒙藏维少数民族言语数据的低成本高效采集,公开共享的言语数据集大小为136 MB近800句。该数据集对于少数民族言语分析研究与教学、语音识别与合成具有重要的研究价值和应用价值,本文的言语数据采集系统仅需少许改动也可以应用于其他语种或者方言的言语数据采集,具有操作简单、部署方便、成本低等特点。This paper introduces a Mongolian,Tibetan and Uyghur speech data set in 2015,which was collected using a remote speech acquisition software system based on Client/Server architecture.The system reduced the cost and improved the efficiency of collecting Mongolian,Tibetan and Uyghur speech data.The data set contains nearly 800 sentences,with a total size of 136 MB.The speech data is of great theoretical and practical value for speech analysis and teaching,speech recognition and synthesis concerning the minority languages in China.The system can be applied into acquiring other language/dialect speeches with slight modification,and it is easy to operate and economic to install.

关 键 词:言语数据 少数民族 蒙藏维 录音 远程采集 

分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论] H2[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象