古汉语双字词自动获取方法的比较与分析被引量：8

A Comparative Study on the Automatic Extraction of Two-character Word from Ancient Chinese

出　　处：《中文信息学报》2012年第4期34-42,共9页Journal of Chinese Information Processing

摘　　要：词汇的自动获取在自然语言生成、计算词典编纂、句法分析以及语料库语言学等领域均有着重要的研究价值。该文针对古汉语双字词的自动获取问题,以《史记》全文语料为例,分别应用基于频率、互信息、假设检验的统计方法获取古汉语双字词,并结合人工标注结果进行了详细的比较和分析,评价了各方法的优缺点及可靠性,为不同应用背景下的古汉语双字词自动获取提供了相应的解决方案。Word extraction is of great importance in the research fields of natural language generation,computational lexicography,parsing,corpus linguistic,etc.To address the issue of automatic extraction of two-character word from ancient Chinese,this paper takes the ＂Records of the Grand Historian＂ corpus as an example,and uses the statistical methods that based on frequency,mutual information and hypothesis testing to extract two-character word,respectively.Then it compares and analyzes the results according to the manual marked result in detail.It paves the way for the scheme design for the two-character word extraction from ancient Chinese in different applications.

关键词：中文信息处理古汉语史记双字词统计模型

分类号：TP391[自动化与计算机技术—计算机应用技术]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

古汉语双字词自动获取方法的比较与分析被引量：8

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

古汉语双字词自动获取方法的比较与分析 被引量：8

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

古汉语双字词自动获取方法的比较与分析被引量：8