文本相似度

作品数:492被引量:2390H指数:24
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:余正涛龙华张鹏程李艳梅马海群更多>>
相关机构:平安科技(深圳)有限公司深圳市腾讯计算机系统有限公司阿里巴巴集团控股有限公司北京邮电大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家社会科学基金中央高校基本科研业务费专项资金国家高技术研究发展计划更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机技术与发展x
条 记 录,以下是1-9
视图:
排序:
基于交互式特征与多尺度特征的文本相似度研究
《计算机技术与发展》2024年第8期86-92,共7页尹春勇 沈子宁 
国家自然科学基金面上项目(6177282)。
针对文本相似度分析过程中缺乏信息传递和忽略多元语义信息而导致相似度计算结果准确率低的问题,结合双向长短期记忆网络(BiLSTM),提出一种新颖的交互式特征与多尺度特征的文本相似度模型(IF-MSF)。首先,利用BiLSTM对句子进行编码提取...
关键词:文本相似度 双向长短期记忆 交互式特征 多尺度特征 通道注意力 
计算机算法类资料的中英文智能翻译被引量:2
《计算机技术与发展》2021年第7期176-181,共6页陈家乐 张艳玲 
2018年教育部第二批产学合作协同育人项目(201802093015)。
当前互联网免费可用的在线翻译系统均是使用通用语料训练出来的神经机器翻译模型,在通用语义环境下翻译出色,而在特定的垂直领域(如计算机专业领域)中,由于训练文本和模型训练算法缺乏针对性,导致翻译结果出现专业词汇错漏,文本晦涩难...
关键词:机器翻译 Word2Vec算法 词向量 文本相似度 GNMT 
基于语义特征抽取的文本聚类研究被引量:3
《计算机技术与发展》2020年第3期46-50,共5页殷硕 王卫亚 柳有权 
中央高校基本科研业务费专项资金(310824173401)。
基于向量空间模型(VSM)的文本聚类会出现向量维度过高以及缺乏语义信息的问题,导致聚类效果出现偏差。为解决以上问题,引入《知网》作为语义词典,并改进词语相似度算法的不足。利用改进的词语语义相似度算法对文本特征进行语义压缩,使...
关键词:文本聚类 语义特征抽取 特征降维 文本相似度 知网 
结合语义和结构的短文本相似度计算被引量:4
《计算机技术与发展》2018年第8期104-108,113,共6页倪高伟 李涛 刘峥 
2015年教育部-中国移动科研基金项目(5-10);江苏省自然科学基金面上项目(BK20171447);江苏省高校自然科学研究面上项目(17JKB520024)
短文本相似度不仅包括语义相似度,还包括语法相似度。目前在短文本相似度度量算法中,大多只分析短文本语义层次的相似性,往往忽略了短文本的语法结构对短文本相似度的重要影响,导致无法捕获大量的文本语义信息,同时在短文本分类任务中...
关键词:EMD Word2Vec 短文本相似度计算 语义相似度 词序结构 
基于文本属性的微博用户相似度研究被引量:1
《计算机技术与发展》2018年第5期17-22,共6页李梦洁 邵曦 
国家自然科学青年基金项目(61401227)
传统的相似度计算方法忽略了用户主观输出的微博文本信息,而这正是体现用户兴趣点的重要元素,只有结合了用户自身信息及其在社交平台上的互动内容,才能相对全面描述一个用户,由此提出基于文本属性的相似用户计算方法。把相似度主要划分...
关键词:微博 社交网络 用户相似度 文本相似度 余弦相似度 层次分析法 
基于LDA模型的文本相似度研究被引量:12
《计算机技术与发展》2016年第4期82-85,89,共5页陈攀 杨浩 吕品 王海晖 
湖北省高等学校优秀中青年团队计划项目(T201206);湖北省智能机器人重点实验室开放基金(HBIR201409)
LDA主题模型是近年来提出的一种具有文本表示能力的非监督学习模型。考虑到传统主题模型在处理大规模文本时存在的局限性,文中提出一种基于LDA模型的文本相似度计算方法。利用LDA为语料库建模,通过Gibbs抽样间接估算模型参数,将文本表...
关键词:文本挖掘 LDA模型 GIBBS抽样 文本相似度 
基于Hadoop平台的文本相似度检测系统的研究被引量:5
《计算机技术与发展》2015年第8期90-93,共4页王小林 肖慧 邰伟鹏 
国家自然科学基金资助项目(6100311);安徽省自然科学研究重点项目(KJ2013Z023;KJ2013A058)
在现有的文本相似度计算方法中,获取关键词权值的TFIDF算法没有完全考虑到关键词在文本中的位置和其在文本库中的离散度对权值的影响,且当处理的文本库中信息量过大时,运行效率较低。针对上述问题,文中提出一种基于语义的信息熵与信息...
关键词:文本相似度 语义 Map/Reduce框架 TFIDF算法 TFIDFWGE算法 
基于LDA的中文文本相似度计算被引量:24
《计算机技术与发展》2013年第1期217-220,共4页孙昌年 郑诚 夏青松 
安徽省自然科学基金(06060716);安徽大学研究生学术创新研究(YQH090047)
传统基于TF-IDF的向量空间模型的文本相似度计算存在高维、数据稀疏、缺乏语义和维度未归一等问题,基于其上的语义扩展的TF-IDF向量空间模型中部分解决了语义问题,但是其基于词典的词语相似度计算限制了其应用范围。提出了一种基于潜在...
关键词:向量空间模型 文本相似度 自然语言处理 潜在狄里克雷分配 主题模型 
教学反思内容自动评估模型研究被引量:2
《计算机技术与发展》2012年第9期173-176,180,共5页邱欢堂 何聚厚 何秀青 
国家985优势学科"教师教育创新平台"项目(GJ9850104);中央高校基本科研业务费专项资金(GK201002028)
教学反思是教师专业能力发展的重要途径,对反思内容进行自动评估是网络环境下教学反思系统亟待解决的关键问题。对网络环境下提交的反思文本进行中文分词、停用词过滤等预处理,采用向量空间模型构建反思文本向量,基于余弦理论计算反思...
关键词:教学反思 自动评估 向量空间模型 文本相似度 
检索报告 对象比较 聚类工具 使用帮助 返回顶部