文本相似度

作品数:492被引量:2390H指数:24
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:余正涛龙华张鹏程李艳梅马海群更多>>
相关机构:平安科技(深圳)有限公司深圳市腾讯计算机系统有限公司阿里巴巴集团控股有限公司北京邮电大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家社会科学基金中央高校基本科研业务费专项资金国家高技术研究发展计划更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=中文信息学报x
条 记 录,以下是1-8
视图:
排序:
融合词性位置特征的多任务汉老双语短文本相似度计算方法
《中文信息学报》2023年第4期18-27,33,共11页李炫达 周兰江 张建安 
国家自然科学基金(61662040)。
老挝语属于低资源语言,在有限的语料中获取更多的语义信息可以有效解决汉语和老挝语短文本相似度计算不准确的问题。多任务学习是有效获取语义信息的一种方法,该文对汉语和老挝语短文本特点进行研究后,提出一种融合词性位置特征的多任...
关键词:汉语-老挝语 词性位置特征 多任务学习 短文本相似度计算 
基于半监督学习的中文社交文本事件聚类方法被引量:5
《中文信息学报》2022年第2期152-159,共8页郭恒睿 王中卿 朱巧明 李培峰 
国家自然科学基金(61772354,61836007);国家自然科学基金青年基金(61806137);江苏高校优势学科建设工程资助项目。
面向社交媒体的事件聚类旨在根据事件特征实现短文本聚类。目前,事件聚类模型主要分为无监督模型和有监督模型。无监督模型聚类效果较差,有监督聚类模型依赖大量标注数据。基于此,该文提出了一种半监督事件聚类模型(SemiEC),该模型在小...
关键词:社交媒体事件聚类 增量聚类 文本相似度 
一种文本相似度与BERT模型融合的手术操作术语归一化方法被引量:2
《中文信息学报》2021年第4期44-50,共7页杨飞洪 孙海霞 李姣 
中国医学科学院医学与健康科技创新工程(2018-I2M-AI-016);中国医学科学院中央级公益性科研院所基本科研业务费(2018PT33024)。
该文探究手术操作术语归一化方法的构建。首先,分析手术操作术语归一化数据集的特点;其次,调研术语归一化的相关方法;最后,结合调研知悉的技术理论方法和数据集特征,建立手术操作术语归一化模型。该文融合文本相似度排序+BERT模型匹配...
关键词:手术术语 归一化 BERT 文本相似度 
面向情感聚类的文本相似度计算方法研究被引量:8
《中文信息学报》2018年第5期97-104,共8页李欣 李旸 王素格 
国家自然科学基金(61573231;61632011;61672331;61432011);山西省科技基础条件平台计划项目(2015091001-0102)
在文本情感分析时,使用无监督的聚类方法,可以有效节省人力和数据资源,但同时也面临聚类精度不高的问题。相似性是文本聚类的主要依据,该文从文本相似度计算的角度,针对情感聚类中文本—特征向量的高维和稀疏问题,以及对评论文本潜在情...
关键词:文本情感聚类 文本相似度计算 文本语义子空间 
基于文档发散度的作文跑题检测被引量:5
《中文信息学报》2017年第1期23-30,共8页陈志鹏 陈文亮 
国家自然科学基金(61572338)
作文跑题检测是作文自动评分系统的重要模块。传统的作文跑题检测一般计算文章内容相关性作为得分,并将其与某一固定阈值进行对比,从而判断文章是否跑题。但是实际上文章得分高低与题目有直接关系,发散性题目和非发散性题目的文章得分...
关键词:跑题检测 文档发散度 文本相似度 
基于WordNet的中泰文跨语言文本相似度计算被引量:12
《中文信息学报》2016年第4期65-70,共6页石杰 周兰江 线岩团 余正涛 
国家自然科学基金(61363044)
文本相似度在信息检索、文本挖掘、抄袭检测等领域有着广泛的应用。目前,大多数研究都只是针对同一种语言的文本相似度计算,关于跨语言文本相似度计算的研究则很少,不同语言之间的差异使得跨语言文本相似度计算很困难,针对这种情况,该...
关键词:WORDNET 中间层语言 跨语言文本相似度 
利用词的分布式表示改进作文跑题检测被引量:6
《中文信息学报》2015年第5期178-184,203,共8页陈志鹏 陈文亮 朱慕华 
国家自然科学基金(61203314;61333018)
作文跑题检测任务的核心问题是文本相似度计算。传统的文本相似度计算方法一般基于向量空间模型,即把文本表示成高维向量,再计算文本之间的相似度。这种方法只考虑文本中出现的词项(词袋模型),而没有利用词项的语义信息。该文提出一种...
关键词:文本相似度 词分布式表示 跑题检测 文本表示 
一种文本相似度及其在语音识别中的应用被引量:10
《中文信息学报》2003年第1期60-64,共5页李红莲 何伟 袁保宗 
国家自然科学重点基金资助项目 (6 978930 1) ;国家 973计划资助项目 (G19980 30 5 0 11)
随着语音识别研究的深入 ,提高通用识别引擎的精度变得越来越困难。但对具体的语音识别任务 ,结合相应的背景 ,采取相应的措施 ,有可能达到很理想的识别精度。在已知语音输入为某有限集元素之一的情形 ,利用文本在发音上的相似度可以大...
关键词:文本相似度 语音识别 计算机应用 中文信息处理 web语音浏览 
检索报告 对象比较 聚类工具 使用帮助 返回顶部