检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:李源 洛桑嘎登 蒋卫丽 LI Yuan;Luosang Gadeng;JIANG Weili(Faculty of Information Engineering,Xinyang Agriculture and Forestry University,Xinyang,Henan 464000,China;School of Information Science and Technology,Tibet University,Lhasa 850000,China;College of Computer Science,Sichuan University,Chengdu 610207,China)
机构地区:[1]信阳农林学院信息工程学院,河南信阳464000 [2]西藏大学信息科学技术学院,拉萨850000 [3]四川大学计算机学院,成都610207
出 处:《计算机工程与应用》2024年第22期162-171,共10页Computer Engineering and Applications
基 金:科技创新2030——“新一代人工智能”重大项目(2022ZD0116100);河南省科技攻关项目(242102210090);信阳农林学院青年教师科研基金(QN2023014);信阳农林学院科研促教学项目(kj-2022007)。
摘 要:命名实体识别(named entity recognition,NER)是信息检索和自然语言处理领域重要且基础的任务。与英文不同,目前大部分的中文NER方法,都面临分词困扰、领域知识缺失的问题。针对以上问题,基于Lattice结构,提出一种结合知识图谱嵌入(knowledge graphs embedding,KGE)和带掩码位置信息的中文NER模型。Lattice语义信息的使用,为补充词粒度信息和解决分词问题奠定了结构基础。知识图谱嵌入的使用,为模型补充并定位了其所缺失的领域知识。而带掩码位置信息的使用,则较好地解决了由于知识图谱的引入而带来的知识噪声问题。所提出的方法在通用领域和垂直领域上均能取得较好的表现,在Weibo、Resume以及CCKS 2017上的F1值分别达到了74.01%、96.62%、94.95%。Named entity recognition(NER)is an important and fundamental task in the field of information retrieval and natural language processing.Different from English,existing Chinese NER methods suffer from Chinese word segmenta-tion(CWS)problem,and lack of domain knowledge.To solve the above problems,this paper proposes a Chinese NER method that combines knowledge graphs embedding(KGE)and position information with mask to enhance Lattice seman-tics.The use of Lattice information lays a structural foundation for completing word-level information and solving the CWS problem.The use of KGE can supplement and locate the missing domain knowledge of pre-trained language models.The use of position information with mask can solve the problem of knowledge noise caused by using knowledge graphs.The method proposed in this paper works well both in the general domain and the specific domain,and the F1 values on Weibo,Resume and CCKS 2017 reach 74.01%,96.62%and 94.95%,respectively.
关 键 词:LATTICE 知识图谱嵌入 位置信息 中文命名实体识别
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.7