检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:李伟[1]
机构地区:[1]安徽工业大学计算机学院,安徽马鞍山243002
出 处:《兰州工业高等专科学校学报》2009年第4期1-3,24,共4页Journal of Lanzhou Higher Polytechnical College
摘 要:分析了中文自然语言处理中句子相似度的计算方法,介绍了基于向量空间模型的TF-IDF的、基于句子语义和基于句子依存关系的三种句子相似度计算模型,并对它们的计算原理、计算方法进行了分析,给出了他们的优缺点.基于向量空间模型的句子相似度计算模型已经比较成熟,一般情况下能够产生较好的效果.由于TF-IDF方法没有考虑这种语义信息,所以传统的TF-IDF方法具有一定的局限性.而基于句子语义或句子的依存结构来进行相似度计算,能达到更好的效果.Chinese sentence similarity computing method is given in this paper, and three sentence similarity computing models including SVM--based TF--ID, sentence semantic model and sentence dependency relationship as well as their theories, computing methods, advantage and disadvantage are introduced. For ignoring the semantic information, the traditional TF--IDF model has some limitation, so sentence similarity computing method based on semantic or dependency relationship has better effect.
分 类 号:TP301.6[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.7