长文档

作品数:121被引量:43H指数:3
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:孙艳丰尹宝才胡永利蓝雯飞万德年更多>>
相关机构:中南民族大学山东浪潮科学研究院有限公司黄冈职业技术学院北京中关村科金技术有限公司更多>>
相关期刊:更多>>
相关基金:国家自然科学基金四川省科技计划项目安徽省自然科学基金四川省重点科技攻关项目更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于TextRank和自注意力的长文档无监督抽取式摘要
《计算机应用与软件》2025年第3期274-283,共10页邢玲 程兵 闫强 
中国科学院随机复杂结构与数据科学重点实验室项目(2008DP173182)。
针对中文长文档自动文本摘要问题,提出将TextRank与自注意力相融合的两种模型:TRAI和TRAO。TRAI将基于统计共现字数得到的句子相似性同基于自注意力得到的句子相关性进行加权求和,作为TextRank边的权重参与迭代计算,对句子进行打分。TRA...
关键词:中文长文本摘要 TextRank 自注意力机制 分布式向量表示 语义信息 融合文档信息 
基于BERT与主题模型联合增强的长文档检索模型被引量:3
《中南民族大学学报(自然科学版)》2023年第4期469-476,共8页覃俊 刘璐 刘晶 叶正 张泽谨 
国家民委中青年英才培养计划项目(MZR20007);湖北省科技重大专项(2020AEA011);武汉市科技计划应用基础前沿项目(2020020601012267)。
尽管将BERT运用在Ad-hoc文档检索领域能够提升任务精确度,但也存在两个显著缺陷:第一,由于BERT存在输入限制,对长文档进行截断会导致文档信息丢失;第二,Ad-hoc文档检索任务的数据集中存在相当数量的领域特定词,而BERT不能较好地学习这...
关键词:文档检索 预训练模型 长文档 主题模型 信息检索 
基于标签注意力的分层ICD自动编码方法
《计算机工程与设计》2023年第7期2207-2213,共7页徐春 涂二妹 马志龙 
国家自然科学基金项目(62266041);新疆高校科学研究计划基金项目(XJEDU2021Y038)。
针对目前自动ICD(international classification of diseases)编码任务存在标签空间大、诊断代码分布不均衡与临床文本表征差的问题,提出一种融合Longformer与标签注意力的分层ICD自动编码模型。借助Clinical-Longformer预训练语言模型...
关键词:自动疾病诊断编码 长文档转换器 标签注意力 预训练语言模型 注意力机制 分层联合学习机制 疾病诊断相关分组 
面向法律判决文书的长文档抽取式文摘方法——BIGDCNN被引量:1
《计算机应用》2023年第S01期67-74,共8页赵嘉昕 崔喆 
四川省科技计划项目(2020YFG0009);四川省重大科技专项(2019ZDZX0005)
针对法律判决文书信息点较多、结构化程度较高,传统的抽取式文摘方法容易产生冗余句子且无法覆盖全部关键信息的问题,提出BIGDCNN(BERT based Improved Gate Dilated Convolutional Neural Network)模型。首先将原始数据进行语料转换获...
关键词:判决文书 抽取式文摘 预训练语言模型 门机制 单模型融合 
一种面向证券信息披露长文档的表格分类方法被引量:2
《中文信息学报》2023年第5期70-79,共10页罗小清 贾网 李佳静 闫宏飞 孟涛 冯科 
针对现有方法在获取证券信息披露长文档中的表格时准确度低的问题,该文提出了一种基于上下文特征融合的表格分类方法。首先对证券信息披露长文档中的表格和其上下文进行抽取和预处理,建立了表格分类的数据集;然后针对表格信息和上下文...
关键词:证券信息披露长文档 表格分类 卷积神经网络 特征融合 
基于Word2Vec及TextRank算法的长文档摘要自动生成研究被引量:1
《现代信息科技》2023年第4期36-38,42,共4页朱玉婷 刘乐 辛晓乐 陈珑慧 康亮河 
甘肃省农业大学盛彤笙科技创新基金(GSAU-STS-2021-15);国家自然基金(32060437);甘肃农业大学省级大学生创新创业训练计划项目(202216018)。
近年来,如何从大量信息中提取关键信息已成为一个急需解决的问题。针对中文专利长文档,提出一种结合Word2Vec和TextRank的专利生成算法。首先利用Python Jieba技术对中文专利文档进行分词,利用停用词典去除无意义的词;其次利用Word2Vec...
关键词:Jieba分词 关键词提取 Word2Vec算法 TextRank算法 
电脑系统维护经验与技巧
《电脑编程技巧与维护》2022年第6期176-176,共1页
怎样让长篇Word文档自动滚动许多Word文档都是长文档,动辄几百页浏览起来很不方便,如果可以让Word自动滚动,方法如下:在Word 2007中打开长篇文档,点击其左上角的“Office按钮”,在弹出的快捷菜单中选择“Word选项”按钮,在弹出的“Word...
关键词:系统维护 WORD 工具栏 快速访问 长文档 对话框 自定义 OFFICE 
BETES:一种中文长文档抽取式摘要方法被引量:4
《小型微型计算机系统》2022年第1期42-49,共8页王宗辉 李宝安 吕学强 游新冬 
国家自然科学基金项目(61671070)资助;国家语委重点项目(ZDI135-53)资助;北京信息科技大学促进高校内涵发展科研水平提高项目(2019KYNH226)资助;北京信息科技大学“勤信人才”培育计划项目(QXTCP B201908)资助。
在自然语言处理领域是最重要的研究工作之一,并随着深度学习的兴起成为研究热点,而中文长文本的摘要抽取面临更大的挑战,存在长文本-摘要语料库不足、摘要抽取信息不准确、目标摘要冗余、摘要句缺失等问题.本文以中文长文本的摘要抽取...
关键词:文本摘要 抽取式摘要 Bert 基本篇章单元 TRANSFORMER 
基于局部注意力机制的弱监督长文档分类被引量:1
《计算机系统应用》2021年第11期54-62,共9页马雯琦 何跃 
国家自然科学基金(71571174)。
自然语言处理中的文档分类任务需要模型从低层级词向量中抽取高层级特征.通常,深度神经网络的特征抽取会利用文档中所有词语,这种做法不能很好适应内容较长的文档.此外,训练深度神经网络需要大量标记数据,在弱监督情况下往往不能取得良...
关键词:文档分类 深度学习 弱监督学习 伪文档 局部注意力机制 
基于多示例学习的长文档检索被引量:2
《无线电工程》2021年第9期886-892,共7页田媛 郝文宁 靳大尉 陈刚 邹傲 
国家自然科学基金资助项目(61806221)。
随着互联网信息的爆炸式增长,文档检索已经成为自然语言处理的热点问题。对于长文本检索,使用传统的基于词频的表示方法往往忽略了文本的语义信息,而使用嵌入模型进行文本表示,受输入长度的影响,长文本通常会被截断,此外,一些相似度计...
关键词:文档检索 多示例学习 相关性得分 
检索报告 对象比较 聚类工具 使用帮助 返回顶部