濒危土家语多模态语料库的构建  

Construction of Multi-Modal Corpus for Endangered Tujia Language

在线阅读下载全文

作  者:谭宇辰 于重重[1] 钱兆鹏 徐世璇[2] TAN Yu-chen;YU Chong-chong;QIAN Zhao-peng;XU Shi-xuan(School of Artificial Intelligence,Beijing Technology,and Business University,Beijing 100048,China;Institute of Ethnology and Anthropology,Chinese Academy of Social Sciences,Beijing 100081,China)

机构地区:[1]北京工商大学,北京100048 [2]中国社会科学院民族学与人类学研究所,北京100081

出  处:《计算机仿真》2023年第10期326-330,共5页Computer Simulation

基  金:教育部人文社会科学研究规划基金项目(21A10011003);教育部人文社会科学研究青年基金项目(21YJCZH117);国家社会科学基金重大项目(14ZDB156)。

摘  要:土家语的使用人口较少且语言活力差,目前正处于濒危状态,亟需对其建立保护措施。针对以上问题,建立了土家语的多模态语料库,包含视频、语音、文本三种模态材料。其中,文本模态信息包括族源历史、传统习俗、民族技艺、村寨介绍、民间传说(故事)五个方面的内容,表现形式是以国际音标、拼音、汉语对译、汉语翻译为四元组的标注文本,用于标注土家语的声音及其含义,以及描述各语料的元数据信息文本。视频与语音模态信息包括各语料的切片文件。土家语多模态语料库的建设能够长期地保留土家语语料资源,对语言学家深入地研究土家语具有十分重要的学术价值和实用意义。The Tujia language is in an endangered state with a small population of speakers and poor language vitality.Aiming at this problem,the multi-modal corpus of Tujia language can provide video,voice and text for researchers.In the corpus,the textual modal information includes five aspects of ethnic history,traditional customs,ethnic skills,village introduction,and folklore(stories).The textual modal includes the international phonetic alphabet,pinyin,Chinese counterparts and Chinese translation,which can record the sound and meaning of Tujia language,as well as the metadata information text describing each corpus.The video and speech modal includes the slice files of each corpus.The construction of a multi-modal corpus of Tujia language can preserve the Tujia language resources for a long time,which is of great academic value and practical significance for linguists to study Tujia language in depth.

关 键 词:土家语 多模态语料库 濒危语言保护 

分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象