涂新辉

作品数:12被引量:85H指数:4
导出分析报告
供职机构:华中师范大学计算机学院更多>>
发文主题:信息检索查询扩展文档中文信息检索概率潜在语义分析更多>>
发文领域:自动化与计算机技术文化科学更多>>
发文期刊:《计算机与数字工程》《计算机工程》《中文信息学报》《北京大学学报(自然科学版)》更多>>
所获基金:国家自然科学基金湖北省自然科学基金国家社会科学基金中央高校基本科研业务费专项资金更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于多粒度语义融合的信息检索方法
《计算机应用》2024年第6期1775-1780,共6页赵征宇 罗景 涂新辉 
国家语委重点项目(ZDI145-22);湖北省教育厅人文社会科学研究项目(18Q028)。
信息检索(IR)是一种通过特定的技术和方法组织、处理信息,以满足用户的信息需求的过程。近年来,基于预训练模型的稠密检索方法取得了巨大的成功;然而,这些方法只利用了文本和词语的向量表征计算查询与文档相关度,忽略了它们短语层面间...
关键词:语义融合 信息检索 稠密检索 预训练模型 文本检索 
面向稠密检索的伪相关反馈方法被引量:2
《计算机应用》2023年第4期1036-1042,共7页胡文浩 罗景 涂新辉 
湖北省教育厅人文社会科学研究项目(18Q028)。
伪相关反馈(PRF)机制是一种自动化的查询扩展(QE)技术,它利用原始查询和初次检索中前N篇文档蕴含的信息构建更加准确的查询,从而进一步提高信息检索系统的性能。但是,现有的面向稠密检索的PRF方法由于对文本的截断处理容易造成语义信息...
关键词:伪相关反馈 查询扩展 信息检索 稠密检索 长文本 
基于Pre-RoBERTa-MTL的中文机器阅读理解模型被引量:4
《计算机应用》2020年第S02期12-18,共7页代寒静 涂新辉 
机器阅读理解(MRC)是指让计算机像人类一样阅读文本,提炼文本信息并回答相关问题。传统的基于深度学习的方法利用双向循环神经网络或者卷积神经网络来对文本进行编码,但这种方法无法有效地捕获文本中的长距离依赖。最新发布的神经网络模...
关键词:机器阅读理解 深度学习 双向循环神经网络 BERT RoBERTa 
基于朴素贝叶斯与潜在狄利克雷分布相结合的情感分析被引量:23
《计算机应用》2016年第6期1613-1618,共6页苏莹 张勇 胡珀 涂新辉 
国家社会科学基金重大项目(12&2D223);国家自然科学基金资助项目(61402191;61300144;61572223);国家语委科研项目(WT125-44);华中师范大学自主科研项目(CCNU14A05014;CCNU14A05015)~~
针对情感分析需要大量人工标注语料的难点,提出了一种面向无指导情感分析的层次性生成模型。该模型将朴素贝叶斯(NB)模型和潜在狄利克雷分布(LDA)相结合,仅仅需要合适的情感词典,不需要篇章级别和句子级别的标注信息即可同时对网络评论...
关键词:情感分析 主题模型 潜在狄利克雷分布 朴素贝叶斯 意见挖掘 
基于位置语言模型的中文信息检索系统的研究被引量:3
《计算机科学》2015年第7期265-269,共5页陈雅兰 胡小华 涂新辉 何婷婷 
国家社会科学基金重大项目(12&2D223);湖北省自然科学基金重点项目(2011CDA034);国家语委"十二五"重点项目(ZDI125-1);国家"十二五"科技支撑计划课题(2012BAK24B01);教育部/国家外国专家局高等学校学科创新引智计划项目(B07042);华中师范大学中央高校基本科研业务费项目(CCNU13A05014;CCNU13C01001;CCNU13F010);国家自然科学基金(61300144)资助
在大多数现有的检索模型中常常忽略了如下事实:一个文档中匹配到的查询词项的近邻性和打分时所基于的段落检索也可以被用来促进文档的打分。受此启发,提出了基于位置语言模型的中文信息检索系统,首先通过定义位置传播数的概念,为每个位...
关键词:位置语言模型 近邻性 段落检索 传播数 
基于排序学习的文本概念标注方法研究被引量:2
《北京大学学报(自然科学版)》2013年第1期153-158,共6页涂新辉 何婷婷 李芳 王建文 
国家自然科学基金(90920005;61003192)资助
提出一种基于排序学习的方法 CRM(concept ranking model),来实现文档的维基百科概念自动标注。首先人工对一定规模的文档进行概念标注,建立训练集合,然后利用排序学习算法在多项特征上得到对概念排序的模型,利用这个概念的排序模型对...
关键词:概念标注 排序学习 维基百科 显示语义分析 
中文维基百科的结构化信息抽取及词语相关度计算方法被引量:24
《中文信息学报》2012年第3期109-115,共7页涂新辉 张红春 周琨峰 何婷婷 
国家自然科学基金重大研究计划课题(90920005);国家自然科学基金资助项目(61003192);教育部/国家外国专家局高等学校学科创新引智计划课题(B07042);湖北省自然科学基金计划项目(2011CDA034;2009CDB145);武汉市晨光计划项目(201050231067);华中师范大学中央高校基本科研业务费项目(CCNU10A02009;CCNU10C01005)
维基百科作为一个以开放和用户协作编辑为特点的Web 2.0知识库系统,具有知识面覆盖度广,结构化程度高,信息更新速度快等优点。然而,维基百科的官方仅提供一些半结构化的数据文件,很多有用的结构化信息和数据,并不能直接地获取和利用。因...
关键词:语义相关度 中文维基百科 结构化信息 
基于概率潜在语义分析的中文信息检索被引量:11
《计算机工程》2008年第2期199-201,共3页罗景 涂新辉 
传统的信息检索模型把词看作孤立的单元,没有考虑自然语言中存在大量的同义词、多义词现象,对召回率和准确率有不利的影响。概率潜在语义模型使用统计的方法建立"文档-潜在语义-词"之间概率分布关系并利用这种关系进行检索。该文将概率...
关键词:概率潜在语义分析 中文信息检索 索引技术 关键词抽取 
基于相关术语群的中文查询扩展被引量:1
《计算机与数字工程》2008年第1期29-31,36,共4页涂新辉 罗景 
查询词语和文档中词语的不匹配是影响文本信息检索效果的一个关键因素。查询扩展技术可以在一定程度上解决这种词的不匹配问题,然而,实验表明,通常简单的查询扩展并不能稳定地提高中文信息检索的检索精度。利用自动构建的相关术语群来...
关键词:中文信息检索 查询扩展 术语抽取 相关术语群 
基于主题词对的文档重排方法被引量:2
《计算机工程与应用》2007年第11期161-163,共3页何婷婷 许婷 瞿国忠 涂新辉 
国家自然科学基金(the National Natural Science Foundation of China under Grant No.60442005; No.60673040);国家社科基金(No.06BYY029);教育部科学技术研究重点项目(No.105117)。
提出了一种基于主题词对的文档重排方法,使得检索结果在保持召回率的前提下提高精确率。主题词对意指能够共同表征同一主题的两个词语,其中一个来自于查询,另一个来自于文档,两者之间具有紧密的联系。主题词对的选择采用概率潜在语义索...
关键词:主题词对 概率潜在语义索引 文档重排 
检索报告 对象比较 聚类工具 使用帮助 返回顶部