检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:陈建超[1] 郑启伦[1] 李庆阳[1] 严桂夺[1]
机构地区:[1]华南理工大学计算机科学与工程学院,广州510640
出 处:《计算机应用研究》2009年第7期2517-2519,2532,共4页Application Research of Computers
基 金:广东省自然科学基金资助项目(07006474);广东省科技攻关资助项目(2007B010200044)
摘 要:一词多义和多词同义是语言中广泛存在的现象,它给自然语言处理带来了很多困难,解决这个难题的有效办法是建立包含上下文信息的同义词集。深入分析了概念、词汇和特征词三者的内在关系,并在此基础上提出了一种基于同义词汇的特征词的关联性,从文本中挖掘同义词集的算法。根据特征词之间存在关联性的特点,算法以成熟的关联规则挖掘算法作为基础,获得了明显优于同类算法的实验效果。算法获得的同义词集附带上下文信息,可有效解决文本中词汇的多义性和同义性问题。The paper analysed deeply the inherent relationship among concept, word and feature-words of both, and then proposed a novel synsets mining algorithm based on the correlation among the feature-words of the words in a synset. The implement of the algorithm was based on the mature association rule mining algorithm, and obtained state-of-the-art performance. Obtained synsets by the algorithm including context information, so they can help solve the problem by synonyms and homonyms in texts.
分 类 号:TP301[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.12.164.78