检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]同济大学经济与管理学院,上海200092 [2]宁波大学信息管理系,宁波315211
出 处:《情报学报》2010年第2期240-245,共6页Journal of the China Society for Scientific and Technical Information
基 金:国家社会科学基金资助项目(07CTQ011).
摘 要:语义词典在语言学和自然语言处理研究中占有相当关键的位置。利用聚类方法自动初步构造词典可以克服人工构造的主观缺陷,但对聚类后的结果比较难于评价。本文借鉴语言模型中的词混乱度概念对已经构建的语义词典进行自动评价,并计算比较SOM学习过程中不同阶段和不同输出网格的混乱度值;最后,与人工主观评价标准相比较,验证了混乱度方法对语义词典的评价与人工主观评价一致性;同时进一步分析了利用混乱度在真实语料库上对初建语义词典评价的客观性。Thesaurus is a major and pivotal problem in the areas of linguistic and nature language processing. The method of automatic clustering constructing thesaurus overcomes subjective shortcomings, but the result of clustering is hard to evaluate. This paper evaluates the effectiveness of clustering automatically by way of perplexity in language models, calculates and compares the change of perplexities of words during clustering at different lattices in SOM process. Finally, compared with artificial subjective evaluation criterion, the perplexity method made consistency and possessed objective property.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.141.28.197