文本语块识别典型方法的比较与分析  被引量:2

Comparison and Analysis on Representative Method of Text Chunking

在线阅读下载全文

作  者:梁颖红[1,2] 曹军[2] 

机构地区:[1]苏州市职业大学计算机学院,江苏苏州215006 [2]东北林业大学机电工程学院,黑龙江哈尔滨150040

出  处:《计算机技术与发展》2008年第11期76-79,共4页Computer Technology and Development

基  金:国家自然科学基金(60575041);哈尔滨市青年科学基金(2005AFQXJ020);2007年黑龙江省博士后基金(520-415029)

摘  要:文本语块识别在自然语言处理领域具有重要作用。以WINNOW、支持向量机和感知器三种典型的语块识别方法为对象,从模型和特征两方面对每种方法进行了剖析,并比较和分析了三种方法与隐马尔科夫模型的优缺点,指出如果为了避免数据稀疏而只采用"词性"特征来识别多种语块,那些对于"词"敏感的短语准确率将会很低。因此针对不同的语块采用不同的特征和策略,不同短语的识别相互借鉴,把不同语块的识别集成在一起,将会起到很好的效果。Text chunking acts as critical function in the field of natural processing field. WINNOW,SVM and perceptron are the study object in this paper. For each algorithm, model and feature are anatomized. And the advantages and disadvantages between these three algorithms and hidden Markov model are compared. The proceedings that should be pay more attention in future text chunking are pointed out. All above can be used for reference for relative research people.

关 键 词:文本语块识别 支持向量机 感知器 WINNOW 隐马尔科夫模型 

分 类 号:TP391.43[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象