检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《计算机技术与发展》2011年第4期94-97,共4页Computer Technology and Development
基 金:国家自然科学基金项目(60903131);云南省社会发展科技计划应用基础研究项目(2009ZC052M);云南省教育厅重点项目(07Z10661)
摘 要:词语相似度计算是信息处理技术中的一个关键问题,主要研究用什么样的方法来计算或比较两个词语的相似性。词语相似度计算可以从广义与狭义两方面考虑,文中从狭义的角度对词语相似度计算进行了研究,通过对语素相似度、字序相似度和词长相似度的分析,提出了一种基于语素、字序和词长的综合词语相似度计算方法。通过词语相似度计算可以修正用户提问中错字、漏字、多字等情况,并且通过实验给出了词语相似度计算中参数的参考值。实验结果验证了该计算方法的有效性。Word similarity computing is a crucial question in information processing technology.It mainly researches what kind of method to calculate or compare the similarity between two words.The word similarity computing can be considered from broad aspect and narrow aspect.Researched word similarity computing from narrow aspect,an integrated word similarity calculation method is proposed by analyzing morpheme's similarity,word order's similarity and word length's similarity.It can revise the following conditions: incorrect word,missing word and extra word.The parameters of the method were decided by experiments.Experiments show that this method has high efficiency.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.233