相似度计算

作品数:1152被引量:4960H指数:28
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:高炜余正涛吕学强兰美辉程戈更多>>
相关机构:平安科技(深圳)有限公司中国科学院哈尔滨工业大学浙江大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家社会科学基金国家高技术研究发展计划中央高校基本科研业务费专项资金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=中文信息学报x
条 记 录,以下是1-10
视图:
排序:
融合词性句法位置特征的汉老双语句子相似度计算
《中文信息学报》2023年第12期76-86,共11页郭雷 周兰江 周蕾越 
国家自然科学基金(61662040)。
汉语和老挝语句子表达存在较大的词序差异,在汉老平行句对语料中融入名词、形容词、量词、数词等词性的位置特征能有效提高句子相似度量的准确性。该文提出一种基于词性句法位置特征的相似度计算方法,首先向汉老双语句子添加特征词标签...
关键词:汉语-老挝语 词性句法位置特征 门控线性卷积网络 双向长短期记忆网络 自注意力机制 
融合语法及结构特征的汉老双语句子相似度计算方法被引量:2
《中文信息学报》2023年第9期73-82,共10页雷歆 周蕾越 周兰江 
国家自然科学基金(61662040,62166023)。
跨语言句子相似度计算是自然语言处理的核心任务之一。标记是老挝语的重要语言特征,汉语中的特定结构也能起到标记的作用,时态与定语广泛存在于汉老双语中。通过分辨时态和定位定语,融入语言特征,能有效提升句子相似度计算的准确率。该...
关键词:老挝语 句子相似度 卷积神经网络 双向门控循环单元 局部推理 
融合词性位置特征的多任务汉老双语短文本相似度计算方法
《中文信息学报》2023年第4期18-27,33,共11页李炫达 周兰江 张建安 
国家自然科学基金(61662040)。
老挝语属于低资源语言,在有限的语料中获取更多的语义信息可以有效解决汉语和老挝语短文本相似度计算不准确的问题。多任务学习是有效获取语义信息的一种方法,该文对汉语和老挝语短文本特点进行研究后,提出一种融合词性位置特征的多任...
关键词:汉语-老挝语 词性位置特征 多任务学习 短文本相似度计算 
融合句子结构特征的汉老双语句子相似度计算方法
《中文信息学报》2022年第2期58-68,共11页李炫达 周兰江 张建安 
国家自然科学基金(61662040)。
在低资源神经机器翻译中,双语平行句对是重要的数据资源,融合语言结构特点能够较好地解决双语句子由于语言差异性导致的句子相似度计算不准确问题。该文提出一种融合句子结构特征的汉老双语句子相似度计算方法。首先,通过该文提出的特...
关键词:汉语-老挝语 资源稀缺型语言 句子结构特征 双向长短期记忆网络 自注意力机制 
基于偏旁部首知识表示学习的汉字字形相似度计算方法被引量:6
《中文信息学报》2021年第12期47-59,共13页刘梦迪 梁循 
北大方正集团有限公司数字出版技术国家重点实验室开放课题;京东商城电子商务研究项目(413313012);国家社会科学基金(18ZDA309);国家自然科学基金(71531012);北京市自然科学基金(4172032)
该文提出了一种字形相似度计算方法,旨在解决汉字中相似字形(称作形似字)的识别和查找问题。首先,提出了汉字拆分方法,并构建了偏旁部首知识图谱;然后,基于图谱和汉字的结构特点,提出2CTransE模型,学习汉字实体语义信息的表示;最后,将...
关键词:知识图谱表示学习 汉字部件 形似字 
融合文本特征的汉老双语句子相似度计算方法被引量:2
《中文信息学报》2021年第10期64-72,共9页谭琪辉 周兰江 刘畅 
国家自然科学基金(61662040)
双语句子相似度旨在计算不同语言句子间的语义相似程度,在信息检索、平行语料库构建、机器翻译等领域有重要作用。由于汉语、老挝语平行语料稀少,且老挝语在语义表达、句子结构上与汉语有明显差异,导致汉老双语句子相似度研究的难度较...
关键词:双语句子相似度 老挝语 迁移学习 文本特征 
基于多头注意力机制Tree-LSTM的句子语义相似度计算被引量:18
《中文信息学报》2020年第3期23-33,共11页胡艳霞 王成 李弼程 李海林 吴以茵 
国家自然科学基金(71771094;71571056);福建省科技计划引导性项目(2017H01010065);2018年华侨大学研究生教育教学改革研究立项项目(18YJG28);泉州市丰泽区科技计划项目(2018FZ06);国家社会科学基金(19BXW110)。
针对现有句子语义相似度计算由于缺乏语义结构信息导致精度低的问题,该文在依存关系树的基础上,提出了一种基于多头注意力机制Tree-LSTM(multi-head attention Tree-LSTM,MA-Tree-LSTM)的句子语义相似度计算方法。首先,MA-Tree-LSTM将...
关键词:句子语义相似度计算 多头注意力机制 Tree-LSTM 语义依存树 
面向情感聚类的文本相似度计算方法研究被引量:8
《中文信息学报》2018年第5期97-104,共8页李欣 李旸 王素格 
国家自然科学基金(61573231;61632011;61672331;61432011);山西省科技基础条件平台计划项目(2015091001-0102)
在文本情感分析时,使用无监督的聚类方法,可以有效节省人力和数据资源,但同时也面临聚类精度不高的问题。相似性是文本聚类的主要依据,该文从文本相似度计算的角度,针对情感聚类中文本—特征向量的高维和稀疏问题,以及对评论文本潜在情...
关键词:文本情感聚类 文本相似度计算 文本语义子空间 
融合CNN和结构相似度计算的排比句识别及应用被引量:4
《中文信息学报》2018年第2期139-146,共8页穆婉青 廖健 王素格 
国家"863"高技术项目(2015AA015407);国家自然科学基金(61573231)
排比句具有结构紧凑、句式整齐、富有表现力等鲜明的特点,广泛应用在各种文体之中,在近几年语文高考的鉴赏类问题中也多有考察,但在自动识别方面的研究还鲜有涉及。该文依据排比句结构相似、内容相关的特点,以句子的词性、词语作为基本...
关键词:排比句 语义相关性 结构相似性 卷积神经网络 
一种基于领域本体的稿件—审阅人相关度度量方法被引量:1
《中文信息学报》2017年第2期163-168,共6页肖刘明镜 周志 邹小军 胡俊峰 
国家自然科学基金(M1321005);国家自然科学基金(61472017)
随着稿件数量的不断增长,审阅人指派越来越成为会议组织者、期刊编辑和基金委员会的一项费时费力的工作,计算机辅助审阅人指派研究也由此得到了更多的关注。稿件—审阅人相关度度量是该研究中的一个重点问题。该文设计了一种基于领域本...
关键词:审阅人指派 相似度计算 领域本体 信息检索 
检索报告 对象比较 聚类工具 使用帮助 返回顶部