唐焕玲

作品数:28被引量:118H指数:5
导出分析报告
供职机构:山东工商学院计算机科学与技术学院更多>>
发文主题:文本分类主题模型BOOSTING文本分类方法文本更多>>
发文领域:自动化与计算机技术文化科学更多>>
发文期刊:《山东大学学报(工学版)》《北京交通大学学报》《数据采集与处理》《计算机科学与探索》更多>>
所获基金:国家自然科学基金国家教育部博士点基金国家重点基础研究发展计划更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-10
视图:
排序:
k-best维特比解耦合知识蒸馏的命名实体识别模型
《计算机科学与探索》2024年第3期780-794,共15页赵红磊 唐焕玲 张玉 孙雪源 鲁明羽 
国家自然科学基金(61976124,61976125,62176140)。
为提升命名实体识别(NER)模型的性能,可采用知识蒸馏方法,但是传统知识蒸馏损失函数因内部存在的耦合关系会导致蒸馏效果较差。为了解除耦合关系,有效提升输出层特征知识蒸馏的效果,提出一种结合k-best维特比解码的解耦合知识蒸馏方法(k...
关键词:命名实体识别(NER) 知识蒸馏 k-best维特比解码 数据增强 
一种去注意力机制的动态多层语义感知机被引量:1
《控制与决策》2024年第2期588-594,共7页刘孝炎 唐焕玲 王育林 窦全胜 鲁明羽 
国家自然科学基金项目(61976124,61976125,62176140)。
Transformer在大规模数据集上取得了优异效果,但由于使用多头注意力使得模型过于复杂,且在小规模数据集上效果不理想.对于多头注意力替换的研究在图像处理领域已取得一些成果,但在自然语言处理领域还少有研究.为此,首先提出一种去注意...
关键词:特征表示 语义感知机 动态深度控制 TRANSFORMER 文本分类 
基于词融合与跨度检测的中文嵌套命名实体识别被引量:2
《计算机应用研究》2023年第8期2382-2386,2392,共6页陈淑振 窦全胜 唐焕玲 姜平 
目前中文命名实体识别模型在识别具有嵌套结构的实体时存在误差,无法准确识别。基于跨度的方法能够找出嵌套实体,但在识别过程中经常生成不包含实体的跨度,无法明确划分跨度边界,增加模型负担。针对此问题,提出了基于词汇融合与跨度边...
关键词:中文嵌套命名实体识别 BERT模型 多词融合 跨度边界检测 
基于u-wordMixup的半监督深度学习模型被引量:1
《控制与决策》2023年第6期1646-1652,共7页唐焕玲 宋双梅 刘孝炎 窦全胜 鲁明羽 
国家自然科学基金项目(61976124,61976125,62176140,61873177,61972235,82001775).
当标注样本匮乏时,半监督学习利用大量未标注样本解决标注瓶颈的问题,但由于未标注样本和标注样本来自不同领域,可能造成未标注样本存在质量问题,使得模型的泛化能力变差,导致分类精度下降.为此,基于wordMixup方法,提出针对未标注样本...
关键词:半监督学习 数据增强 深度学习 文本分类 
融合词信息嵌入的注意力自适应命名实体识别被引量:5
《计算机工程与应用》2023年第8期167-174,共8页赵萍 窦全胜 唐焕玲 姜平 陈淑振 
国家自然科学基金(61976125,61976124)。
缺少分词信息及未登录词、无关词干扰是字符级中文命名实体识别面临的主要问题,提出了融合词信息嵌入的注意力自适应中文命名实体识别模型,在新词发现的基础上,将字向量嵌入与词级信息嵌入融合作为模型输入,减少了未登录词对模型的影响...
关键词:中文命名实体识别 注意力机制 动态缩放因子 未登录词 
基于双路分段注意力神经张量网络的临床文本关系抽取被引量:2
《电子学报》2023年第3期658-665,共8页隗昊 唐焕玲 周爱 张益嘉 陈飞 鲁明羽 
国家自然科学基金(No.61976124,No.62072070)。
目前,生物医学领域的关系提取工作已经取得了长足的发展,但是在面对句式复杂的临床医学文本时,由于存在大量长句以及句中实体对的高密度分布,限制了当前关系抽取模型性能的进一步提升.本文提出了一种基于张量权重矩阵的双向门控循环单...
关键词:关系抽取 临床文本 神经张量网络 分段注意力机制 样本不平衡 
面向时钟领域的BERT-LCRF命名实体识别方法被引量:4
《计算机工程与应用》2022年第18期218-226,共9页唐焕玲 王慧 隗昊 赵红磊 窦全胜 鲁明羽 
国家自然科学基金(61976124,61976125,61773244,61772319)。
命名实体识别是构建时钟领域知识图谱的关键步骤,然而目前时钟领域存在标注样本数量少等问题,导致面向时钟领域的命名实体识别精度不高。为此,利用预训练语言模型BERT进行时钟领域文本的特征提取,利用线性链条件随机场(Linear-CRF)方法...
关键词:命名实体识别 预训练语言模型 条件随机场 自注意力机制 深度学习 
面向小样本关系抽取的自适应胶囊网络被引量:1
《计算机应用研究》2022年第8期2357-2362,共6页张晓明 窦全胜 陈淑振 唐焕玲 
国家自然科学基金资助项目(61976124,61976125)。
小样本关系抽取任务是自然语言处理中的热点问题,旨在使用低成本的标注数据训练关系抽取模型。目前广泛使用的原型网络存在类原型表达不准确、不完整等问题。为了克服该问题,提出一种自适应胶囊网络(adaptive capsule network,ACNet),AC...
关键词:关系抽取 小样本 自适应 胶囊网络 动态路由 
结合LDA与Word2vec的文本语义增强方法被引量:24
《计算机工程与应用》2022年第13期135-145,共11页唐焕玲 卫红敏 王育林 朱辉 窦全胜 
国家自然科学基金(61976124,61976125,62176140,61873177,61972235,82001775)。
文本的语义表示是自然语言处理和机器学习领域的研究难点,针对目前文本表示中的语义缺失问题,基于LDA主题模型和Word2vec模型,提出一种新的文本语义增强方法Sem2vec(semantic to vector)模型。该模型利用LDA主题模型获得单词的主题分布...
关键词:LDA主题模型 Word2vec模型 语义词向量 语义相似度 文本分类 
融合主题模型和动态路由的小样本学习方法
《数据采集与处理》2022年第3期586-596,共11页张淑芳 唐焕玲 郑涵 刘孝炎 窦全胜 鲁明羽 
国家自然科学基金(61976124,61976125,61773244,61772319)。
针对小样本学习标注训练样本过少,导致特征表达力弱的问题,本文结合有监督主题模型(Supervised LDA,SLDA)和动态路由算法提出一种新的动态路由原型网络模型(Dynamic routing prototypical network based on SLDA,DRP-SLDA)。利用SLDA主...
关键词:小样本学习 元学习 原型网络 有监督主题模型 文本分类 
检索报告 对象比较 聚类工具 使用帮助 返回顶部