文本相似度计算

作品数:70被引量:584H指数:11
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:周兰江李艳梅郭庆琳王振振何明更多>>
相关机构:昆明理工大学北京邮电大学华中师范大学杭州电子科技大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划河南省教育厅自然科学基金广西壮族自治区自然科学基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
融合多头图注意力的文本相似度计算
《应用科技》2025年第1期205-212,共8页申晓旭 王忠燎 包训成 吴醒宇 张茂萱 张艳迪 
现有的文本相似度计算方法在处理长文本或具有复杂结构句子时,无法有效挖掘文本的深层语义,从而影响相似度计算的精度。为了解决这一问题,本文提出了一种融合图注意力的孪生网络框架,该框架结合了图神经网络的图嵌入和节点嵌入2种编码...
关键词: 图神经网络 图嵌入 注意力机制 文本表示 文本相似度 自然语言处理 深度学习 
深度学习中文本相似度计算研究综述
《计算机应用与软件》2024年第11期1-14,共14页徐传丽 周世杰 吴春江 
四川省科技厅重大专项(2019YFG0399,2020YFG0460);四川省科技厅重点研发项目(2019YFG0505)。
文本相似度计算是自然语言处理的重要任务之一,通过总结分析学术界提出的经典方法和最新进展,对深度学习中文本相似度计算的文本表示和相似度计算两个模块进行分类整理和全面综述。社交网络的发展衍生出了短文本相似度计算这一重要子任...
关键词:文本表示 文本相似度 短文本 自然语言处理 神经网络 
基于图像处理和深度学习的答题卡评分算法
《电脑知识与技术》2024年第20期29-32,共4页张志 方少卿 
2023年度铜陵职业技术学院科学研究项目(自然科学一般项目)“基于机器视觉的答题卡识别及评分系统的设计与实现”(TZY23ZRYB01)。
为解决传统答题卡评分方法耗时耗力且易出错的缺陷,该研究提出了一种新算法,可对答题卡拍照后的图像进行自动识别和评分。该算法包括两个部分:一是图像处理部分,对答题卡图像进行预处理和选择题答案提取;二是深度学习部分,对主观题答案...
关键词:答题卡识别 图像处理 深度学习 OCR识别 文本相似度计算 
基于Simhash算法的题库查重系统的设计与实现
《科学技术创新》2024年第9期91-94,共4页熊良钰 邓伦丹 
Simhash算法是一种基于局部敏感哈希(LSH)的技术,以其快速的计算速度和高度的查重准确性而知名。该算法通过将文本特征转换为二进制码,进而通过计算这些二进制码之间的汉明距离来评估文本的相似度。在文本去重和重复文档检测等多个领域,...
关键词:Simhash算法 汉明距离 题库查重系统 文本相似度计算 哈希函数 
融合房东生成内容与房客生成内容的共享住宿平台信息服务价值共创机制研究
《情报科学》2023年第6期84-93,共10页翟姗姗 郭致怡 查思羽 叶飞 张亚男 
国家社会科学基金重大项目“新时代我国文献信息资源保障体系重构研究”(19ZDA345)。
【目的/意义】探索房东生成内容和房客生成内容对共享住宿平台信息服务价值共创的影响机制,以深化文本资源在共享住宿平台的应用价值,为共享住宿平台及其参与者提供参考。【方法/过程】基于价值共创理论,构建文本资源视角下共享住宿平...
关键词:共享住宿平台 信息服务 用户生成内容 文本相似度计算 价值共创 
继电保护定值模型建立及语义识别技术研究被引量:3
《自动化技术与应用》2023年第5期128-132,共5页熊学海 万春竹 杨波 赵凌 齐雪雯 
贵州电网有限责任公司科技项目(GZKJXM20190394)。
针对各厂家继电保护定值信息语义不标准,严重影响信息审核和应用的问题,提出基于知识图谱和文本相似度计算的继电保护定值信息智能识别模型。建立语义预处理、语义智能识别、定值信息知识图谱等模块。基于正则表达式处理字母、数字以及...
关键词:定值信息模型 文本识别 文本相似度计算 
融合词性位置特征的多任务汉老双语短文本相似度计算方法
《中文信息学报》2023年第4期18-27,33,共11页李炫达 周兰江 张建安 
国家自然科学基金(61662040)。
老挝语属于低资源语言,在有限的语料中获取更多的语义信息可以有效解决汉语和老挝语短文本相似度计算不准确的问题。多任务学习是有效获取语义信息的一种方法,该文对汉语和老挝语短文本特点进行研究后,提出一种融合词性位置特征的多任...
关键词:汉语-老挝语 词性位置特征 多任务学习 短文本相似度计算 
融合词语多特征的汉老短文本相似度计算
《小型微型计算机系统》2023年第4期759-765,共7页郭雷 周兰江 周蕾越 
国家自然科学基金项目(61662040)资助。
词语作为文本构成中最具有语义表达的单位,将词语更多的特征如形态学、词性、词性权重等融入到词语语义的表达中,将提升文本相似度量的准确性.该文提出一种融合词语多特征的汉老短文本相似度计算方法,首先利用双向长短期记忆网络(BiLSTM...
关键词:汉语-老挝语 形态学 双向长短期记忆网络 ESIM交互注意力机制 
融合关键词和语义特征的汉越文本相似度计算被引量:1
《小型微型计算机系统》2022年第6期1309-1314,共6页潘润海 高盛祥 余正涛 刘奕洋 尤丛丛 
国家自然科学基金项目(61761026,61972186,61732005,61672271,61762056)资助;国家重点研发计划项目(2019QY1802,2019QY1801,2019QY1800)资助;云南省高科技人才项目(201606,202105AC160018)资助;云南省重大科技专项计划项目(202002AD080001-5,202103AA080015)资助;云南省基础研究计划项目(202001AS070014,2018FB104)资助;昆明理工大学省级人培项目(KKSY201703005)资助.
汉越文本相似度计算是实现汉越文本理解和文本分类的基础.目前使用神经网络来计算文本相似度是一个有效方法,但由于文本较长、冗余信息较多,神经网络难以有效捕获文本间的相似信息,同时汉-越平行语料稀缺导致模型泛化性能一般,此方法受...
关键词:汉-越 文本相似度 BERT 关键词 神经网络 
混合神经网络模型与注意力机制的地址匹配算法被引量:4
《计算机工程与科学》2022年第5期901-909,共9页陈健鹏 陈剑 佘祥荣 水新莹 陈刚 
安徽省重点研究与开发计划(202104a05020071)。
中文地名地址的标准化在当前智慧城市的建设中起到至关重要的作用。传统的地名地址标准化技术通常使用基于文本字符层面的相似度计算或规则库匹配的方法,对复杂、特殊或冗余地址的处理效果较差。通过将地址标准化任务转换为针对地址相...
关键词:地名地址 文本相似度计算 注意力机制 混合神经网络 智慧城市 
检索报告 对象比较 聚类工具 使用帮助 返回顶部