基于大规模语料库的介词结构搭配库构建  被引量:8

Large-scale Corpus Based Preposition Structure Collocation Base

在线阅读下载全文

作  者:邢丹 饶高琦[1,2] 荀恩东[1] 王诚文 XING Dan;RAO Gaoqi;XUN Endong;WANG Chengwen(School of Information Science,Beijing Language and Culture University,Beijing 100083,China;School of Chinese International Education,Beijing Language and Culture University,Beijing 100083,China)

机构地区:[1]北京语言大学信息科学学院,北京100083 [2]北京语言大学汉语国际教育研究院,北京100083

出  处:《中文信息学报》2020年第11期1-8,共8页Journal of Chinese Information Processing

基  金:国家重点研发计划“云计算和大数据”重点专项项目(2018YFB1005105)。

摘  要:语言知识可帮助计算机正确地处理自然语言,介词结构知识作为语言知识的一种,对自然语言处理和语言教学研究有很重要的意义。该文基于大规模语料库构建了高质量的介词结构搭配库。首先在前人研究的基础上,对介词进行归类并建立了介词搭配知识体系,而后设计并实现了从大数据中获取介词结构搭配知识的规则,最后对抽取结果及其数据规模进行了统计和评估,主要目的是通过形式手段获取高质量的介词结构搭配,同时也为自然语言处理和语言学基础研究及应用提供数据支持。Prescription structure is of great significance to natural language processing and language teaching research.This paper constructs a high-quality preposition structure collocation base from large-scale corpus.First,we determine the classification scheme of preposition and collect preposition collocation.Then,we design and acquire rules of prepositional structure collocation from large data.Finally,we test and analyze the extracted result.

关 键 词:语料库 知识抽取 介词结构搭配 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象