李红莲

作品数:38被引量:213H指数:6
导出分析报告
供职机构:北京信息科技大学更多>>
发文主题:语音识别支持向量机文本分类口语对话系统评测更多>>
发文领域:自动化与计算机技术电子电信文化科学动力工程及工程热物理更多>>
发文期刊:《计算机工程与应用》《中国科教创新导刊》《电子学报》《电脑与信息技术》更多>>
所获基金:国家自然科学基金国家社会科学基金北京市教委科技发展计划国家重点基础研究发展计划更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于多特征融合的中医药问题生成模型
《人工智能与机器人研究》2024年第3期673-683,共11页酒敬天 李红莲 
目的:提出一种基于多特征融合的中医药问题生成模型(MFFQG),以改善现有的自动生成技术在处理特定领域时存在的领域关键词信息缺失和生成问题表达不规范问题。方法:利用RoBERTa向量和五笔向量捕捉输入序列的语义特征和字形特征,同时融合...
关键词:中医药 问题生成 句法分析 五笔特征 
融合情感-主题双通道信息的评论摘要生成模型被引量:1
《数据分析与知识发现》2024年第6期30-43,共14页李红莲 陈浩天 张乐 吕学强 田驰 
国家自然科学基金项目(项目编号:62171043);国家语委重点项目(项目编号:ZDI145-10);北京市教育委员会科学研究计划项目(项目编号:KM202311232001)的研究成果之一。
【目的】针对传统的自动摘要无法深度融合评论的情感和主题信息,无法解决词汇不足的问题,提出一种融合情感-主题双通道信息的评论摘要生成模型。【方法】运用TextRank动态抽取评论主题句,借助PyABSA模型抽取主题句中的方面词-情感词序...
关键词:评论摘要 双通道 注意力机制 指针生成网络 
融合内容和图片特征的中文摘要生成方法研究被引量:2
《数据分析与知识发现》2024年第3期110-119,共10页全安坤 李红莲 张乐 吕学强 
国家自然科学基金项目(项目编号:62171043);北京信息科技大学“勤信人才”培育计划基金项目(项目编号:QXTCP B201908)的研究成果之一。
【目的】为解决现有根据单一文本特征生成的中文摘要质量不佳问题,提出一种融合内容和图片特征的中文摘要生成方法。【方法】使用BERT提取文本特征,使用ResNet提取图片特征,该特征能够对文本特征进行补充与验证,并利用注意力机制将两种...
关键词:特征融合 BERT ResNet 注意力机制 摘要生成 
面向长文本的抽取式摘要生成方法
《电脑知识与技术》2023年第20期8-12,16,共6页全安坤 李红莲 
北京信息科技大学“勤信人才”培育计划基金项目(项目编号:QXTCP B201908)。
为了缓解自动文本摘要技术在长文本上效果不理想的问题,提出了一种面向长文本的抽取式摘要生成方法。首先,使用WoBERT模型获取融入义原信息的文本特征,并利用句子间的余弦相似度代替TextRank中边的权重进行迭代运算,得到句子的TextRank...
关键词:长文本 抽取式摘要 主题关键词 义原 冗余信息处理 
一种融合义原的中文摘要生成方法被引量:1
《中文信息学报》2022年第6期146-154,共9页崔卓 李红莲 张乐 吕学强 
国家自然科学基金(61671070);国家语委重点项目(ZDI135-53);国家社会科学基金(14@ZH036)。
文本摘要旨在对冗长的文本进行简短精确的总结,同时保留文本的原始语义。该文提出一种融合义原的中文摘要生成方法(Add Sememe-Pointer Model,ASPM),以词为单位在LCSTS数据集上进行实验。算法利用基于Seq2Seq的指针网络模型以解决由于...
关键词:文本摘要 义原 指针网络 文本语义 词向量 
特征融合的中文专利文本分类方法研究被引量:8
《数据分析与知识发现》2022年第4期49-59,共11页肖悦珺 李红莲 张乐 吕学强 游新冬 
国家自然科学基金项目(项目编号:62171043);北京信息科技大学“勤信人才”培育计划基金项目(项目编号:QXTCP B201908)的研究成果之一。
【目的】为解决现有专利分类方法未考虑专利文本中的未登录词而导致召回率低的问题,提出一种特征融合的专利文本分类方法。【方法】基于特征融合的中文专利文本分类方法,利用不断更新的专有名词词表,将经过BERT预训练的句子向量与专有...
关键词:专利 文本分类 特征融合 BERT TF-IDF 
一种融合关键词的生成式摘要方法被引量:4
《计算机应用研究》2021年第11期3289-3292,3358,共5页李伯涵 李红莲 
国家自然科学基金资助项目(61671070);国家语委重点资助项目(ZDI135-53);自然科学重点实验室基金资助项目(6142006190301);北京信息科技大学校促进内涵重点培育项目(5211910940);北京信息科技大学“勤信人才”培育计划资助项目(QXTCPB201908)。
针对生成式文本摘要中模型对文本语义了解不够充分以及生成摘要缺乏关键信息的问题,提出一种融合关键词的中文摘要生成模型KBPM(Key-BERT-Pen model)。首先使用TextRank方法将文本中关键词抽取出来,然后将抽取出的关键词与原文一起经过B...
关键词:文本摘要 BERT预训练模型 主题关键词 双重注意力机制 指针模型 
人大报告内容的文本分类被引量:4
《计算机工程与设计》2021年第6期1772-1778,共7页喻航 李红莲 吕学强 
国家自然科学基金项目(61671070);北京成像技术高精尖创新中心基金项目(BAICIT-2016003);国家社会科学基金重大基金项目(14@ZH0363);国家语委重点基金项目(ZDI135-53)。
针对区级人大报告特定的几方面内容进行文本分类,可以让人大工作人员对不同工作内容进行快速分辨,是构建人大报告辅助生成系统的必要内容。为对不同内容分类,基于TF-IDF(词频-逆文档频率)与知识增强语义表示模型ERNIE(enhanced represen...
关键词:人大报告 文本分类 词频-逆文档频率 知识增强语义表示模型 速度 
区级人大报告中的地名自动标注研究被引量:1
《北京信息科技大学学报(自然科学版)》2020年第6期31-36,共6页喻航 李红莲 吕学强 
国家自然科学基金项目(61671070);北京成像技术高精尖创新中心项目(BAICIT-2016003);国家社会科学基金重大项目(14@ZH0363);国家语委重点项目(ZDI135-53)。
针对区级人大报告中地名的自动标注问题,采用BERT(bidirectional encoder representations from transformers)预训练语言模型、条件随机场模型加改进双向长短时记忆神经网络的方法来识别地名,并利用屏蔽敏感词的算法实现对识别到的地...
关键词:人大报告 自动标注 BERT 神经网络 
区级人大报告辅助生成系统
《电脑与信息技术》2019年第6期48-51,55,共5页喻航 李红莲 吕学强 周建设 夏红科 刘志勇 
国家自然科学基金项目(项目编号:61671070);北京成像技术高精尖创新中心项目(项目编号:BAICIT-2016003);国家社会科学基金重大项目(项目编号:14@ZH0363);国家语委重点项目(项目编号:ZDI135-53)
人民代表大会制度是我国的根本政治制度,是中国特色社会主义制度的重要组成部分。区级人大报告辅助生成系统是以模拟写作活动的技术为基础,以人大常委工作报告的写作方式和成品为对象。首先进行数据采集及预处理,并且制定标注规则,对人...
关键词:辅助生成 人大报告 写作 
检索报告 对象比较 聚类工具 使用帮助 返回顶部