基于搭配对的汉语形容词-名词聚类  被引量:11

Clustering Of Chinese Adjectives Nouns Based on Compositional Pairs

在线阅读下载全文

作  者:闻扬[1] 苑春法[1] 黄昌宁[1] 

机构地区:[1]清华大学计算机系智能技术与系统国家重点实验室,北京100084

出  处:《中文信息学报》2000年第6期45-50,共6页Journal of Chinese Information Processing

基  金:自然科学基金!(6 97730 31);国家重点基础研究 973项目!(G19980 30 5 0 7)

摘  要:本文提出了一个双向分级聚类的算法同时对不同词性的词进行聚类。在聚类过程中 ,不同词性的词的聚类交替进行 ,相互影响。我们以最小描述长度的原理为基础构造了目标函数。为了减小数据稀疏的影响 ,又提出了修饰度的与修正距离的概念。将此算法应用于汉语形容词 -名词的搭配对 ,对形容词与名词进行聚类 。This paper proposes a bidirctional hierarchical clustering algorithm of simultaneous clustering words of different categories.During clustering,the process is interactional and alternant.We construct an objective function based on Minimum Description Length (MDL).In order to solve the problem caused by sparse data two concepts of modificatory degree and modificatory distance are proposed.The further application to clustering Chinese adjectives and nouns demonstrates the algorithm is effective.

关 键 词:双向分级聚类 搭配对 修饰度 最小描述长度 汉语 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象