文本相似度

作品数:492被引量:2390H指数:24
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:余正涛龙华张鹏程李艳梅马海群更多>>
相关机构:平安科技(深圳)有限公司深圳市腾讯计算机系统有限公司阿里巴巴集团控股有限公司北京邮电大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家社会科学基金中央高校基本科研业务费专项资金国家高技术研究发展计划更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机工程x
条 记 录,以下是1-10
视图:
排序:
结合依存图卷积的中文文本相似度计算研究被引量:1
《计算机工程》2025年第3期76-85,共10页胡书林 张华军 邓小涛 王征华 
湖北省重点研发计划项目(2022BAA051)。
目前中文文本相似度计算能够通过词嵌入技术在语义层面判别文本相似度,但通常忽略了文本中蕴含的丰富的句法结构信息,而以词为单位的中文句法分析与动态词嵌入模型中以字为单位的分词粒度不一致,使得当前大多数结合句法分析的研究只能...
关键词:图卷积神经网络 依存句法分析 动态词嵌入 文本相似度 注意力机制 
文本相似度计算方法综述被引量:4
《计算机工程》2024年第9期18-32,共15页魏嵬 丁香香 郭梦星 杨钊 刘辉 
国家重点研发计划项目(2022YFE0138600);教育部人文社会科学研究规划基金(23YJA870011);重庆市计算智能重点实验室项目(2020FF02)。
文本相似度计算是自然语言处理的一部分,用来计算两个词、句子及文本之间的相似程度,具有多种应用场景,文本相似度计算的研究对于人工智能的发展有着重要作用。文本相似度计算起初基于字符串表面,随着词向量的提出,文本相似度计算可进...
关键词:文本相似度 字符串 词向量 预训练模型 深度学习 
基于多模型加权组合的文本相似度计算模型被引量:5
《计算机工程》2023年第10期97-104,共8页刘栋 杨辉 姬少培 曹扬 
国家自然科学基金企业创新发展联合基金(U20B2049);提升政府治理能力大数据应用技术国家工程实验室2018—2019年开放基金项目(w-2019010)。
针对传统文本相似度计算模型存在的未考虑语义及结构信息、容易忽略文本特征细节信息等问题,建立一种基于多模型加权组合的文本相似度计算模型。在考虑次序、主题、语义等内容的基础上,对句子的每个单词进行嵌入表示,利用最大池化操作和...
关键词:文本特征 多词嵌入 多层次比较 浅层语法树 线性加权 文本相似度 
多重检验加权融合的短文本相似度计算方法被引量:12
《计算机工程》2021年第2期95-102,共8页石彩霞 李书琴 刘斌 
中国博士后科学基金(2017M613216);陕西省自然科学基金(2017JM6059);陕西省重点研发计划(2019ZDLNY07);陕西省博士后基金(2016BSHEDZZ121)。
传统相似度计算方法仅考虑文本结构特征或语义信息,从而导致准确率较低。结合短文本特征稀疏的特性,提出一种多重检验加权融合的短文本相似度计算方法 MCWFS。使用基于改进编辑距离、考虑词频、基于Word2vec与LSTM的3种方法分别计算相似...
关键词:短文本相似度 多重检验加权融合 编辑距离 语义信息 词频 
基于多注意力CNN的问题相似度计算模型被引量:15
《计算机工程》2019年第9期284-290,共7页冯兴杰 张乐 曾云泽 
国家自然科学基金青年科学基金(61301245,61201414);赛尔网络下一代互联网技术创新项目(NGII20160605)
在智能客服问答系统中,用户所提问句具有咨询意图复杂、上下文相关性弱以及口语化等特点,导致问句相似度计算的准确率不高,出现答非所问的情况。提出一种基于卷积神经网络的相似度计算模型MA-CNN。通过2个不同的注意力机制,同时关注词...
关键词:智能客服 文本相似度 词语语义 句子语义 卷积神经网络 注意力机制 
基于服务相似度的移动用户近似邻居选取方法被引量:1
《计算机工程》2018年第5期162-167,173,共7页缪峰 贾华丁 熊于宁 
中央高校基本科研业务费专项资金(JBK1407119);四川省教育厅科技金融与创业金融基地课题(JR201512)
现有近似邻居集选取方法存在分类较粗、标签缺失等问题,在移动服务方面无法取得较好的效果。为此,提出一种有效的近似邻居集选取方法。通过改进短文本相似度计算方法,基于服务介绍内容,求出移动服务之间的相似度,根据服务相似度,改进用...
关键词:移动服务推荐 邻居筛选 短文本相似度 近似邻居 AP聚类 
融合要素及主题的汉越双语新闻话题分析被引量:3
《计算机工程》2016年第9期186-191,共6页夏青 严馨 余正涛 汪建成 高盛祥 洪旭东 
国家自然科学基金资助项目(61462055;61472168;61262041);云南省自然科学基金资助重点项目(2013FA130)
双语话题分析与发现是当前国内外的研究热点,但针对特定文本研究较少。为此,在汉越双语新闻文本中,基于双语主题分布词的汉越文本相似度计算方法,提出融合标题、关键词以及实体等并针对新闻文本的新闻要素特征。将这些新闻特征信息融合...
关键词:双语新闻话题分析 汉越双语 文本相似度 主题 自适应聚类 
基于语义信息的中文短信文本相似度研究被引量:9
《计算机工程》2012年第13期58-60,70,共4页刘金岭 宋连友 范玉虹 
河北省科技支撑计划基金资助项目(10213581);淮安科技计划基金资助项目(HAG09061)
在传统TF-IDF模型基础上分析中文短信文本中特征词的语义信息,提出一种中文短信文本相似度度量方法。对短信文本进行预处理,计算各词语的TF-IDF值,并选择TF-IDF值较高的词作为特征词,借助向量空间模型的词语向量相似度,结合词语相似度加...
关键词:短信文本 相似度 TF-IDF模型 特征词 向量空间模型 
文本相似度计算在主观题评分中的应用被引量:6
《计算机工程》2012年第5期288-290,共3页程传鹏 齐晖 
河南省教育厅自然科学基金资助项目(2008B520046)
针对传统主观题自动评分准确度低的问题,提出一种基于文本相似度计算的主观题评分方法。利用扩展的《同义词词林》计算词语之间的相似度,根据标准答案中的词语和学生答卷中的词语以及词语之间的相似度构造二部图,通过二部图的最大匹配...
关键词:自动评分 文本相似度 二部图 匈牙利算法 最大匹配 
基于CRFs和领域规则的业务名称识别被引量:3
《计算机工程》2011年第11期200-202,共3页赵延平 曹存根 谢丽聪 
中国科学院计算技术研究所和NEC中国研究院合作基金资助项目(LC-2009-044)
提出一种基于条件随机场(CRFs)和领域规则的业务名称识别方法。通过实验词及词性的不同组合选择特征集合,由该特征训练得到CRFs模型,利用该模型测试得到业务术语,采用2-gram及编辑距离2种度量方式进行相似度计算,利用领域规则和相似度...
关键词:业务名称识别 条件随机场 文本相似度 编辑距离 
检索报告 对象比较 聚类工具 使用帮助 返回顶部