检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]清华大学计算机系智能技术与系统国家重点实验室,北京100084
出 处:《中文信息学报》2000年第6期45-50,共6页Journal of Chinese Information Processing
基 金:自然科学基金!(6 97730 31);国家重点基础研究 973项目!(G19980 30 5 0 7)
摘 要:本文提出了一个双向分级聚类的算法同时对不同词性的词进行聚类。在聚类过程中 ,不同词性的词的聚类交替进行 ,相互影响。我们以最小描述长度的原理为基础构造了目标函数。为了减小数据稀疏的影响 ,又提出了修饰度的与修正距离的概念。将此算法应用于汉语形容词 -名词的搭配对 ,对形容词与名词进行聚类 。This paper proposes a bidirctional hierarchical clustering algorithm of simultaneous clustering words of different categories.During clustering,the process is interactional and alternant.We construct an objective function based on Minimum Description Length (MDL).In order to solve the problem caused by sparse data two concepts of modificatory degree and modificatory distance are proposed.The further application to clustering Chinese adjectives and nouns demonstrates the algorithm is effective.
关 键 词:双向分级聚类 搭配对 修饰度 最小描述长度 汉语
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.134.118.113