相似性度量方法

作品数:95被引量:529H指数:14
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:徐永洋蔡青林陈蕾英陈岭孙建伶更多>>
相关机构:中国科学院电子科技大学华中科技大学浙江大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金中央高校基本科研业务费专项资金陕西省自然科学基金国家高技术研究发展计划更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 主题=文本x
条 记 录,以下是1-2
视图:
排序:
基于异质信息网络的文本相似性度量方法
《中文信息学报》2023年第9期108-120,共13页马秋微 赵书良 赵妍 
国家社会科学基金(13&ZD091,18ZDA200);河北省重点研发计划项目(20370301D);河北师范大学重大关键技术攻关项目(L2020K01)。
文本相似性度量对基于文本的分类,聚类以及排序等有着广泛的影响。现有的大部分文本相似性度量方法不仅文本特征粒度单一化,而且忽略了非结构化文本数据中的结构化信息。该文将文本相似性度量问题转化为加权异质信息网络中的节点相似性...
关键词:相似性度量 加权异质信息网络 元路径 文本挖掘 
一种结合TF-IDF和Simhash的科技项目文本相似性度量方法被引量:5
《电子技术应用》2023年第6期89-93,共5页孙北宁 吕维新 曾俊 肖衡 
国家自然科学基金项目(61702442)。
为了提高科技项目文本相似性度量的准确性和性能,将TF-IDF和Simhash相结合,提出了一种新的科技项目文本相似性度量方法。首先,该方法对科技项目文本进行预处理得到词项集合,再使用TF-IDF计算词项集合中每个词项的权重值,并选取具有较高...
关键词:科技项目文本 文本相似度 TF-IDF Simhash算法 
检索报告 对象比较 聚类工具 使用帮助 返回顶部