文本相似度

作品数:492被引量:2390H指数:24
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:余正涛龙华张鹏程李艳梅马海群更多>>
相关机构:平安科技(深圳)有限公司深圳市腾讯计算机系统有限公司阿里巴巴集团控股有限公司北京邮电大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家社会科学基金中央高校基本科研业务费专项资金国家高技术研究发展计划更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机工程与设计x
条 记 录,以下是1-10
视图:
排序:
融合注意力及句法的短文本相似度计算方法被引量:3
《计算机工程与设计》2022年第11期3127-3134,共8页蔚佳璇 张起贵 
山西省基础研究项目自然科学基金项目(2013011017-3);太原理工大学科技创新基金项目(9002-03011843)。
针对短文本相似度计算中无法充分利用文本中不同部分的不同重要性且较少考虑句法信息而导致准确率较低的问题,提出一种融合注意力及句法信息的短文本相似度计算方法。通过在语义相似度部分设计混合注意力结构体系,准确提取交互信息,凸...
关键词:短文本相似度 混合注意力机制 依存句法分析 关系矩阵 加权融合 
改进Bi-LSTM的文本相似度计算方法被引量:5
《计算机工程与设计》2022年第5期1397-1403,共7页冯月春 陈惠娟 
宁夏回族自治区科学技术厅重点研发计划基金项目(2019BEB02020);宁夏高等学校科学研究基金项目(NGY2018-166)。
为提高自然语言处理任务中文本相似度检测的准确率,提出一种改进双向长短期记忆网络(Bi-LSTM)的文本相似度计算方法。将输入的句子转换成多个单词向量,通过Bi-LSTM提取出每个单词向量的最佳词特征,引入注意力机制,减小非关键因素的影响...
关键词:文本相似度 深度学习 双向长短期记忆网络 注意力机制 多层相似加权 上下文信息 
民航旅客不文明行为信息自动匹配方法
《计算机工程与设计》2021年第12期3415-3421,共7页曹卫东 高德 
民航科技创新重大专项基金项目(MHRD20160109);民航安全能力基金项目(TRSA201803);国家自然基金民航联合基金项目(U1833114)。
为实现民航旅客不文明行为信息与规则自动匹配,提出一种将胶囊网络与门控循环单元结合的民航旅客不文明行为信息与规则自动匹配的方法。充分利用文本语义信息,进行文本相似度的计算,有效解决传统方法在民航旅客不文明行为信息中存在繁...
关键词:不文明旅客 文本相似度 门控循环单元 胶囊网络 集成模型 
多模型加权融合的文本相似度计算被引量:7
《计算机工程与设计》2021年第11期3239-3245,共7页田红鹏 马博 冯健 
陕西省自然科学基础研究计划基金项目(2020JM-533)。
目前传统的文本相似度方法大多数存在未考虑语义及结构信息,容易忽略文本特征细节信息等问题。针对上述问题,提出多模型加权融合的文本相似度计算算法。利用词频、词性、词句位置3个特征共同计算句子相似度;为发现文本的结构信息方面,...
关键词:文本相似度 特征融合 词移距离 分层池化 句向量 
综合词位置和语义信息的专利文本相似度计算被引量:8
《计算机工程与设计》2018年第10期3087-3091,共5页夏冰 李宝安 吕学强 
国家自然科学基金项目(61671070);北京成像技术高精尖创新中心基金项目(BAICIT-2016003);国家语委重大课题基金项目(ZDA125-26;ZDI135-53)
为解决传统文本相似度计算方法没有充分考虑专利文本结构特殊性以及计算文本相似度过程中往往忽略词汇间语义信息的问题,在传统方法的基础上,考虑词性以及专利文本的结构特征,将IPC分类号、标题、摘要、权利要求书作为主要研究对象,词...
关键词:文本相似度 专利文本结构 向量空间模型 词向量 余弦相似度 
基于多谓词语义框架的长短语文本相似度计算被引量:3
《计算机工程与设计》2018年第4期1022-1028,1052,共8页王景中 杨彬彬 何云华 
北京市教委科技创新服务能力建设基金项目(pxm2017-014212-000002)
已有的文本相似度计算方法处理长短语时只考虑比较其核心词部分,但核心词的修饰词也会对语义造成一定影响,导致文本相似度计算结果不够准确。为此提出基于多谓词语义框架的长短语文本相似度计算,将文本内容进行多谓词语义框架填充,利用...
关键词:文本相似度 语义框架 多谓词 依存句法分析 层次分析 
短文本相似度研究及其在微博话题检测中的应用被引量:11
《计算机工程与设计》2015年第11期3128-3133,共6页黄贤英 陈红阳 刘英涛 
国家自然科学基金项目(61173184);重庆市教委科技计划基金项目(KJ100821)
针对微博短文本特征稀疏导致文本相似性度量不精确的问题,提出一种基于多视角的微博短文本相似度算法。根据词形相同与词义相近寻找微博短文本中的公共块,以公共块所含词项总数与公共块之间的组合顺序,构建基于公共块序列的语义相似度;...
关键词:微博短文本相似度 微博话题检测 结构化信息 公共块序列 语义相似度 
基于领域特征词加权的文本相似度计算被引量:2
《计算机工程与设计》2012年第11期4338-4342,共5页欧阳宁 罗艳 
广西自然科学基金项目(2011GXNSFA018158);广西科学研究与技术开发计划基金项目(桂科攻11107006-45;桂科攻0996028)
为了改善一个词可能在多个类别中有较大的互信息而模糊了词的类别信息的问题,提出了一种改进的特征选择方法。该方法利用特征词在不同类别之间的表征差异建立领域特征词(即最能表现一个领域的信息的一系列词)从而可以对用互信息建立的...
关键词:互信息 文本分类 特征选择 领域特征词 文本相似度 
基于潜在特征词的文本相似度计算方法被引量:5
《计算机工程与设计》2011年第2期572-575,共4页杨云 吴亚男 李健 
国家自然科学基金项目(50372037);陕西省科技厅自然科学基础研究计划项目(SJ08E103);陕西科技大学科研启动基金项目(BJ10-01)
针对传统文本相似度计算方法中,词语权重定义TF-IDF方法仅考虑词频信息,而没有考虑特征词在文本中的位置因子,提出了相应的改进方法。另外,在建立文本向量模型,选择特征词时,对于与高权值词语有较高共现率、语义相近的潜在特征词也进行...
关键词:特征选择 位置因子 词语关联度 潜在特征词 文本相似度 
基于部件的文本相似度计算被引量:4
《计算机工程与设计》2006年第18期3444-3446,共3页程玉柱 邬书跃 
相似度的计算在信息检索及文档复制检测等领域具有广泛的应用前景。研究了文本相似度的计算方法,以汉字数学表达式理论为基础,提出了一种新的文本部件粒度表示方法,根据部件频次建立文本特征向量空间模型,并在此模型基础上给出了相应的...
关键词:信息检索 复制检测 相似度 自然语言处理 部件 
检索报告 对象比较 聚类工具 使用帮助 返回顶部