检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:张弛 周艳玲[1] 张贯虹[1] ZHANG Chi;ZHOU Yan-ling;ZHANG Guan-hong
机构地区:[1]合肥学院计算机科学与技术系
出 处:《赤峰学院学报(自然科学版)》2019年第5期19-23,共5页Journal of Chifeng University(Natural Science Edition)
基 金:合肥学院重点教学研究项目(2018hfjyxm08);安徽省自然科学基金青年项目(051308085QF115);高校优秀青年人才支持计划重点项目(GXYQZD2016275)
摘 要:为了更加准确地计算文本特征权重,提高文本相似度计算的精确度,文章提出了一种基于《知网(HowNet)》语义知识库的加权语义复杂网络文本相似度计算方法.该方法首先以特征词为节点,以特征词窗口共现为边,以特征词的TF-IDF值为特征词节点的初始权重,以融合共现频率和概念间语义距离计算特征词节点之间边的权重,构建加权语义文本复杂网络.然后利用综合特征指数作为加权语义网中文本的特征权重.最后基于公开数据集和KNN算法进行文本聚类实验,实验结果表明,在基于F-度量值标准上本文提出的方法要优于传统基于向量空间模型的TF-IDF方法和另一种结合复杂网络权重的方法.
关 键 词:复杂网络 特征词 KNN算法 文本相似度 HOWNET
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.151