文本相似度

作品数:492被引量:2390H指数:24
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:余正涛龙华张鹏程李艳梅马海群更多>>
相关机构:平安科技(深圳)有限公司深圳市腾讯计算机系统有限公司阿里巴巴集团控股有限公司北京邮电大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家社会科学基金中央高校基本科研业务费专项资金国家高技术研究发展计划更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机应用与软件x
条 记 录,以下是1-9
视图:
排序:
深度学习中文本相似度计算研究综述
《计算机应用与软件》2024年第11期1-14,共14页徐传丽 周世杰 吴春江 
四川省科技厅重大专项(2019YFG0399,2020YFG0460);四川省科技厅重点研发项目(2019YFG0505)。
文本相似度计算是自然语言处理的重要任务之一,通过总结分析学术界提出的经典方法和最新进展,对深度学习中文本相似度计算的文本表示和相似度计算两个模块进行分类整理和全面综述。社交网络的发展衍生出了短文本相似度计算这一重要子任...
关键词:文本表示 文本相似度 短文本 自然语言处理 神经网络 
基于外卖数据的社区团购选品系统研究与应用被引量:1
《计算机应用与软件》2022年第11期43-48,118,共7页李瑾 刘云鹏 邱虹 
国家自然科学基金项目(61906170);浙江省教育厅项目(Y201840695);宁波市自然科学基金项目(2018A610164)。
新零售时代下,社区团购开创了一种全新的团购模式,正确的选品能够帮助社区团购平台提升客户留存,并且通过商品的差异化特点裂变出更多客户。通过对不同社区外卖数据的分析,找出社区对商品需求的差异性,并将外卖菜品名与常见大众菜谱进...
关键词:社区团购 短文本相似度 选品 推荐 数据分析 
基于NLP的兴趣点数据上线系统设计与实现
《计算机应用与软件》2020年第12期17-25,共9页张先荣 郑贵俊 
全面丰富的兴趣点(Point of Interest,POI)数据直接影响着地图App厂商的地理位置服务。针对传统的POI数据采集与上线方式周期长、速度慢的问题,提出一种高效的采集、上线POI数据的方式。将数据上线工作细化为:数据采集,数据格式化,数据...
关键词:数据采集 数据判重 POI数据 Word2Vec Siamese-LSTM 短文本相似度 
一种融合词项关联关系和统计信息的短文本建模方法
《计算机应用与软件》2016年第10期28-31,56,共5页马慧芳 曾宪桃 李晓红 贠宁 
国家自然科学基金项目(61363058;61163039);甘肃省自然科学基金青年科技基金项目(145RJZA232);中国科学院计算技术研究所智能信息处理重点实验室开放基金项目(IIP2014-4)
传统文本表示方法通常基于词袋模型,而词袋模型是基于文本中词项之间是相互独立的假设。最近也提出一些通过词共现来获取词项之间关系的统计分析方法,却忽略了词项之间的隐含语义。为了解决传统文本表示方法词袋模型对文本语义的忽略问...
关键词:内联关系 外联关系 词语相似度 文本相似度 短文本相似度 
一种新的Web中文文本聚类方法研究被引量:3
《计算机应用与软件》2013年第12期222-225,287,共5页叶宇飞 安世全 代劲 
传统的文本聚类缺少语义信息,文本的特征向量高维稀疏,忽略了Web文本的特殊性。为了解决这些问题,提出一种Web中文文本聚类方法。在基于知网(HowNet)的概念空间基础上过滤非名词,分析文本中重要词汇的语义,对标签特征集与正文特征集进...
关键词:WEB文本聚类 特征降维 知网 文本相似度 
一种改进的基于向量空间文本相似度算法的研究与实现被引量:36
《计算机应用与软件》2012年第2期282-284,共3页李连 朱爱红 苏涛 
通过分析传统的基于向量空间模型(VSM)文本相似度计算算法存在的不足,提出一种改进的文本相似度计算算法。改进算法充分考虑到了文本间相同特征词对文本相似度的影响,有效减少了相似度低的文本干扰。仿真实验和系统运行结果验证了改进...
关键词:向量空间 文本相似度 特征词 覆盖度 
基于文本相似度的网页消重策略被引量:6
《计算机应用与软件》2011年第11期228-229,278,共3页刘书一 
针对在网页检索结果中经常出现内容相同或相似的问题,提出了一种通过计算网页相似度的方法进行网页消重。该算法通过提取网页特征串,特征串的提取在参考以往特征码提取的基础上,加入了文本结构特征的提取,通过比较特征串之间差异性的基...
关键词:网页消重 网页特征码 文本相似度 编辑距离 
Levenshtein距离在编程题自动评阅中的应用研究被引量:7
《计算机应用与软件》2011年第5期209-212,共4页周汉平 
目前对编程题的自动评阅技术多建立在程序能正常运行的基础上。实践表明,这样的评价基础并不适用初学计算机程序语言的学生,大量的答题由于很小的编译错误而被判为零分。如何对一个无法正常运行的程序文本给出一个正确度的评价,这个课...
关键词:莱文斯坦距离 文本相似度 相似度度量 自动阅卷 
以事件为特征的文本聚类方法被引量:1
《计算机应用与软件》2010年第8期195-197,共3页王崇国 
文本聚类是聚类的一个重要的研究分支,是聚类方法在自然语言处理领域的具体应用。研究表明事件在大量的文本中是客观存在的,诸多文本是由事件组成的,事件是文本表示的最小语义单位。探讨了以事件为特征的文本聚类方法,首先给出了基于事...
关键词:文本聚类 事件 文本相似度 概念格 
检索报告 对象比较 聚类工具 使用帮助 返回顶部