文档相似度

作品数:48被引量:254H指数:9
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:张国英沙芸袁鑫攀宋玲林劼更多>>
相关机构:清华大学北京大学语联网(武汉)信息技术有限公司河北大学更多>>
相关期刊:《郑州大学学报(理学版)》《信息与电脑》《计算机工程与应用》《保密科学技术》更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家社会科学基金河北省自然科学基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
高校智慧材料收集系统设计与研究
《信息与电脑》2024年第22期28-30,共3页刘海标 叶成权 李万益 张渝荣 
文章对高校智慧材料收集系统进行了需求分析,并基于Spring Boot框架进行了功能设计和架构设计,对其中的关键功能全文检索、文档相似度、提取文档主题进行了研究,并提出了相应的实现方案。
关键词:智慧材料收集管理系统 需求分析 全文检索 文档相似度 主题提取 
基于图神经网络文档相似度的实体与关系层次匹配方法被引量:1
《郑州大学学报(理学版)》2023年第6期8-14,共7页赵文彬 王佳琦 吴峰 任雁 安寅生 
国家自然科学基金项目(61373160);河北省自然科学基金项目(F2021210003);河北省教育厅青年基金项目(QN2020197)。
针对文本中深层语义难以计算的问题,提出了基于句法依存关系的多头图注意力实体关系联合抽取模型和融合层次类型的文档相似性匹配。首先通过多头图注意力网络对文本进行实体关系抽取,然后设计融合层次类型的词移距离相似性计算方法以及...
关键词:实体关系抽取 相似性 层次类型 图神经网络 
基于深度文件检测的数据失泄密溯源技术研究与应用
《信息系统工程》2022年第11期76-79,共4页吴江煌 
提出了一种全新的文件失泄密溯源技术,能够对文件进行全面跟踪,从而使泄密过程一目了然。我们借鉴数据血缘的相关理论来维护文件数据关联图谱,初始化阶段将完成对现有文件的密级内容识别标记,该过程涉及已删除数据的恢复和文件相似及同...
关键词:数据防泄密 数据过滤 文档相似度 关联图谱 文件溯源 
融合主题模型及双语词向量的汉缅双语可比文档获取方法被引量:2
《中文信息学报》2021年第1期88-95,共8页李训宇 毛存礼 余正涛 高盛祥 王振晗 张亚飞 
国家自然科学基金(61732005,61662041,61761026,61866019,61972186);国家重点研发计划(2019QY1802,2019QY1801);云南省应用基础研究计划重点项目(2019FA023);云南省中青年学术和技术带头人后备人才项目(2019HB006)。
缅甸语属于资源稀缺型语言,汉缅双语可比文档是获取平行句对的重要数据资源。该文提出了一种融合主题模型及双语词向量的汉缅双语可比文档获取方法,将跨语言文档相似度计算转化为跨语言主题相似度计算问题。首先,使用单语LDA主题模型分...
关键词:主题模型 双语词向量 文档相似度 汉语—缅甸语 双语可比文档 
基于文档关系改进的向量空间模型被引量:6
《河北大学学报(自然科学版)》2020年第3期322-327,共6页何丹丹 吴树芳 徐建民 
国家社科基金后期资助项目(17FTQ002)。
由于用户查询信息不足而导致传统向量空间模型检索结果不够准确,针对此问题,提出了一种基于文档关系改进的向量空间模型.改进模型将初始检索结果中排名靠前的高相关文档组成基准集,通过计算初始检索结果集中每篇文档与基准集的相似度,...
关键词:文档关系 向量空间模型 文档相似度 信息检索 
基于知识画像的文档相似度分析模型被引量:2
《信息技术》2020年第2期116-120,共5页苏亚维 艾中良 
科技项目申报文档有较强的领域特征、统一的文档结构和特殊的相似度分析需求,文中提出了一种基于文档知识画像的多维度多粒度相关性计算模型,简称DLSM,该模型综合不同维度权重,不同粒度文本的相似性分析,结果更加精确合理。实验表明,DLS...
关键词:文档知识画像 相似度分析 多维度多粒度计算模型 领域文档 
基于文档关系的扩展信念网络检索模型被引量:3
《情报学报》2019年第11期1160-1165,共6页徐建民 何丹丹 吴树芳 
国家社会科学基金后期资助项目“基于术语关系的贝叶斯网络检索模型扩展”(17FTQ002);河北省自然科学基金项目“基于贝叶斯网络的话题识别与追踪方法研究”(F2015201142)
合理利用文档关系可以提高模型的检索性能。针对基本信念网络检索模型未考虑文档关系的不足,通过在基本模型上增加一层文档节点,提出一种具有两层文档节点的扩展信念网络检索模型,给出了模型的拓扑结构和概率推导。在拓扑结构中,术语与...
关键词:信念网络 文档关系 检索模型 文档相似度 
基于加权层次子树模型的XML文档相似度的计算
《中国科技纵横》2019年第14期39-40,共2页刘菲 
XML因其具有的半结构化、可扩展性和自描述性等特点,在互联网中得到广泛应用.海量的XML文档也带来数据搜索的困难.本文基于加权层次子树模型,提出模型的相似度计算方法.首先考虑元素的语义信息,将XML文档的元素语义信息纳入计算中,其次...
关键词:XML文档 加权层次子树模型 文档相似度 计算 
基于电子作业挖掘的学生学习预警模型研究被引量:2
《软件工程》2019年第4期25-28,共4页张笑非 段先华 刘镇 钱萍 
江苏科技大学2016高教研究立项课题资助项目"基于电子作业挖掘的学生学习预警模型研究"(项目编号:GJKTY201625);江苏科技大学2015年学校重点教改课题资助项目"计算机类专业通用课程优质教学资源建设的研究与实践";教育部在线教学研究中心2017混合教学试点单位项目(项目编号:2017137);江苏省教育信息化研究课题资助项目"基于云计算的泛在学习生态系统研究与实现"(项目编号:20172217)
混合式教学的普及使得电子作业成为一种评价学生学习效果的重要数据来源,利用机器学习对电子作业进行建模是对学生学习预警的一种有益探索。本文在对电子作业进行分词和向量化基础上,通过k-means聚类和轮廓系数来判断其语义的多样性,通...
关键词:文档向量 K-MEANS聚类 轮廓系数 文档相似度 图论效率 
基于文本和公式的科技文档相似度计算被引量:8
《数据分析与知识发现》2018年第10期103-109,共7页徐建民 许彩云 
河北省自然基金项目"基于贝叶斯网络的话题识别与追踪方法研究"(项目编号:2015201142);国家社会科学基金后期资助项目"基于术语关系的贝叶斯网络检索模型扩展"(项目编号:17FTQ002)的研究成果之一
【目的】针对仅利用文本信息计算科技文档相似度存在的不足,提出一种结合文本和公式信息计算科技文档相似度的方法。【方法】将单个公式的特征元素映射为位置向量,计算得到单个公式的相似度;计算文档间的公式覆盖度和相似度;结合文本和...
关键词:公式相似度 文档相似度 覆盖度 科技文档 
检索报告 对象比较 聚类工具 使用帮助 返回顶部