检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:曾小芹 Zeng Xiaoqin(Department of Information and Science,Yuzhang Normal University,Nanchang Jiangxi 330103,China)
机构地区:[1]豫章师范学院信息科学系,江西南昌330103
出 处:《信息与电脑》2017年第21期51-52,共2页Information & Computer
摘 要:为了更精准地在海量信息中检索目标,笔者在前人研究基础上提出了一种中文语句相似度的层次递进算法。中文语句相似度综合考虑了无序相似度及有序相似度两个因素:无序相似度通过中文语句切词后得到具有相同或相近词义的词语比例;有序相似度则是计算语句各成分位置词相似度。其中,还考虑了句型转换因素及语句语气参数的修正,如此层层递进得到中文语句的相似度。最后通过实验对比验证其合理性。The author puts forward a multilevel algorithm of Chinese sentence similarity on the basic of predecessors'research.The algorithm considers disordered similarity and ordered similarity.Disordered similarity is obtained by computing the ratio of synonyms after Chinese segmentation.Ordered similarity is got by calculating the corresponding similarity of component location words.Meanwhile,the sentence pattern conversion is also considered,and if it be a Chinese question,sentence mood parameter need to be used to modify the result.Finally the algorithm rationality is verified by contrast experiment.
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.147.8.67