基于遗传算法的汉语构词研究  

Study of Chinese word formation based on genetic algorithm

在线阅读下载全文

作  者:苑春法[1] 李莼[1] 崔永华[2] 邢红兵[2] 

机构地区:[1]清华大学计算机科学与技术系 [2]北京语言文化大学,北京100083

出  处:《清华大学学报(自然科学版)》2001年第4期222-226,共5页Journal of Tsinghua University(Science and Technology)

基  金:国家"九七三"重点基础研究发展规划项目!(19980 30 5 0 7) ;社会科学基金项目! (97@yy0 0 1-3;国家自然科学基金资助项目! (6 93

摘  要:从语素数据库中获取语素的构词知识 ,研究汉语的构词规律对于汉语信息处理具有非常重要的意义。汉语语素数据库是一个大规模的含有丰富汉语构词知识的数据库 ,而遗传算法是求解大规模复杂组合寻优问题的一种有效手段。在汉语构词规律的研究中 ,首次引入遗传算法对带有构词方式、类序、字义组合以及首、尾语义类 (分大类层次和中类层次 ) 5个特征的汉语二字复合名词的构词规律进行了探索 ,并取得了阶段性成果。实验证明 。The Chinese morpheme database is a large knowledge database about word formation. Chinese Natural Language Processing (NLP) needs to acquire word formation knowledge for Chinese compound words from this database. This paper describes the use of the genetic algorithm for Chinese NLP to study multi feature Chinese word formation. The analysis studied the combinatorial regulation of two character compound words with five features, the formation pattern, the sequence of morpheme category, the mean related to morphemes and the sense category of two morphemes (in major or medium categories). The results show that the genetic algorithm is an effective method for studying Chinese word formation based on the Chinese morpheme database.

关 键 词:遗传算法 汉语语素 构词规律 构词知识 语素数据库 汉语信息处理 

分 类 号:TP391.12[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象