中文命名实体识别

作品数:168被引量:919H指数:16
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:冯元勇施水才吕学强俞鸿魁张华平更多>>
相关机构:中国科学院大学广东工业大学四川大学中国科学院更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划中央高校基本科研业务费专项资金湖南省自然科学基金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=中文信息学报x
条 记 录,以下是1-10
视图:
排序:
融合汉字多级特征与文本局部特征的中文命名实体识别
《中文信息学报》2024年第9期93-107,共15页张慧 秦董洪 白凤波 罗余特 刘成星 宋蕃桦 
广西科技基地和人才专项(桂科AD23026054);广西壮族自治区中央引导地方科技发展资金项目(桂科ZY24212045)。
针对目前中文命名实体识别模型在复杂语境下准确率较低的问题,添加更多汉字特征以弥补词向量表形、表音方面的不足,引入更多先验知识,丰富语义特征;同时设计一种兼顾全局特征与局部特征的编码器,提升模型面对复杂语境时的鲁棒性与泛化性...
关键词:字形特征 拼音特征 文本局部特征 命名实体识别 
基于多任务标签一致性机制的中文命名实体识别
《中文信息学报》2023年第12期87-97,共11页吕书宁 刘健 徐金安 陈钰枫 张玉洁 
国家重点研究与发展计划项目(2019YFB1405200);国家自然科学基金(61976015,61976016,61876198,61370130)。
实体边界预测对中文命名实体识别至关重要。现有研究为改善边界识别效果而提出的多任务学习方法大多仅考虑与分词任务进行简单结合,但由于缺少包含多任务标签的训练数据,导致无法学到多个任务之间的标签一致性关系。该文提出一种新的基...
关键词:中文命名实体识别 多任务学习 标签一致性机制 BERT模型 
融合多重嵌入的中文命名实体识别被引量:3
《中文信息学报》2023年第4期63-71,共9页尹成龙 陈爱国 
最近,将词嵌入融合到基于字嵌入的模型已经被证明是有效的。但是,大多数现有的研究都忽视了对部首信息的使用。该文提出一种将词嵌入、字嵌入和部首嵌入相融合的新方法,该方法利用词嵌入和字嵌入的优点,并考虑了部首中包含的大量语义信...
关键词:命名实体识别 多重嵌入 注意力机制 部首信息 
面向少量标注数据的中文命名实体识别被引量:5
《中文信息学报》2023年第3期101-111,共11页张昀 黄橙 张玉瑶 黄经纬 张宇德 黄丽亚 刘艳 丁可柯 王秀梅 
国家自然科学基金(61977039)
训练数据的缺乏是目前命名实体识别存在的一个典型问题。实体触发器可以提高模型的成本效益,但这种触发器需要大量的人工标注,并且只适用于英文文本,缺少对其他语言的研究。为了解决现有TMN模型实体触发器高成本和适用局限性的问题,提...
关键词:中文命名实体识别 实体触发器 Mogrifier LSTM结构 联合损失函数 注意力机制 
基于词典和字形特征的中文命名实体识别被引量:2
《中文信息学报》2023年第3期112-122,共11页于舒娟 毛新涛 张昀 黄丽亚 
国家自然科学基金(61977039)
命名实体识别是自然语言处理中的一项基础任务。通过基于词典的方法增强词内语义和词边界信息是中文命名实体识别的主流做法。然而,汉字由象形字演变而来,汉字字形中包含着丰富的实体信息,这些信息在该任务中却很少被使用。该文提出了...
关键词:中文命名实体识别 词典 字形特征 
多粒度融合的命名实体识别被引量:1
《中文信息学报》2023年第3期123-134,共12页孙红 王哲 
国家自然科学基金(61472256,61170277,61703277)
目前主流的命名实体识别算法都是从词汇增强的角度出发,引入外部词汇信息提升NER模型获取词边界信息的能力,并未考虑到中文字结构信息在此任务中的重要作用。因此,该文提出多粒度融合的命名实体识别算法,同时引入中文字结构与外部词汇信...
关键词:信息抽取 中文命名实体识别 注意力机制 词汇增强 中文字形特征 
基于多级别特征感知网络的中文命名实体识别被引量:2
《中文信息学报》2022年第9期84-92,共9页宋威 周俊昊 
国家自然科学基金(61673193,62076110);江苏省自然科学基金(BK20181341);中国博士后科学基金(2017M621625)。
当前中文命名实体识别方法仅采用字级别或词级别特征方法进行识别,不能兼顾字和词级别的优点,难以获取足够的字形或者词义信息。针对此问题,该文提出一种基于多级别特征感知网络的中文命名实体识别方法。首先提出一种双通道门控卷积神...
关键词:命名实体识别 双通道门控卷积 自注意力机制 Highway网络 
面向教育领域的基于SVR-BiGRU-CRF中文命名实体识别方法被引量:7
《中文信息学报》2022年第7期114-122,共9页张召武 徐彬 高克宁 王同庆 张乔乔 
国家自然科学基金联合基金(U1811261);中央高校基本科研业务费专项资金(N2116019)。
在教育领域中,命名实体识别在机器自动提问和智能问答等相关任务中都有应用。传统的中文命名实体识别模型需要改变网络结构来融入字和词信息,增加了网络结构的复杂度。另一方面,教育领域中的数据对实体边界的识别要十分精确,传统方法未...
关键词:中文命名实体识别 BiGRU-CRF 简单向量表示层(SVR) 
基于深度学习的中文命名实体识别最新研究进展综述被引量:33
《中文信息学报》2022年第6期20-35,共16页张汝佳 代璐 王邦 郭鹏 
国家自然科学基金(62172167)。
中文命名实体识别(CNER)任务是问答系统、机器翻译、信息抽取等自然语言应用的基础底层任务。传统的CNER系统借助人工设计的领域词典和语法规则,取得了不错的实验效果,但存在泛化能力弱、鲁棒性差、维护难等缺点。近年来兴起的深度学习...
关键词:中文命名实体识别 深度学习 综述 
基于多颗粒度文本表征的中文命名实体识别方法被引量:4
《中文信息学报》2022年第4期90-99,共10页田雨 张桂平 蔡东风 陈华威 宋彦 
国家自然科学基金(U1908216);辽宁省重点研发计划(2019JH2/10100020)。
中文命名实体识别常使用字符嵌入作为神经网络模型的输入,但是中文没有明确的词语边界,字符嵌入的方法会导致部分语义信息的丢失。针对此问题,该文提出了一种基于多颗粒度文本表征的中文命名实体识别模型。首先,在模型输入端结合了字词...
关键词:中文命名实体识别 多颗粒度文本表征 N-GRAM 
检索报告 对象比较 聚类工具 使用帮助 返回顶部