利用系统整合提高中文分词精度的方法研究  

Research on the Method of Improving the Accuracy of Chinese Word Segmentation Using System Integration

在线阅读下载全文

作  者:刘智文[1] 

机构地区:[1]厦门大学信息科学与技术学院,厦门361005

出  处:《现代计算机》2009年第10期7-10,共4页Modern Computer

基  金:国家自然科学基金(No.60573189);863项目(No.2006AA01Z139);863项目(No.2006AA010108-3);福建省重点科技项目(No.2006H0038);福建省基金项目(No.2006J0043)

摘  要:实现一个基于条件随机场模型的中文分词工具,同时还提出利用多系统组合来提升中文分词成绩的构想,并用实验数据分析几个系统整合后所具有的分词潜力。实现几个系统的整合并将分词最好的成绩提高0.56个百分点。Presentes a Chinese word segmentation system based on the Conditional Random Fields (CRFs) and a theory to integrate different kinds of Chinese word segmentation system in order to improve the Chinese word segmentation score. Analyzes the potential ability of the integrated systems and finds a way to integrate each systems based on simple n-gram language model. This method can improve the F scores of the Chinese word segmentation by 0.56 percent.

关 键 词:条件随机场 中文分词 多系统整合 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象