检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:罗凯威 罗文兵[1,2] 黄琪 王明文[1,2] LUO Kaiwei;LUO Wenbing;HUANG Qi;WANG Mingwen(School of Digital Industry,Jiangxi Normal University,Shangrao,Jiangxi 334000,China;School of Computer and Information Engineering,Jiangxi Normal University,Nanchang,Jiangxi 330022,China)
机构地区:[1]江西师范大学数字产业学院,江西上饶334000 [2]江西师范大学计算机信息工程学院,江西南昌330022
出 处:《中文信息学报》2023年第8期75-85,共11页Journal of Chinese Information Processing
基 金:国家自然科学基金(62266023);江西省教育厅研究生创新基金项目(YC2022-s348);江西省教育厅科学技术研究项目(GJJ210325,GJJ2200354)。
摘 要:中学数学术语抽取方法未考虑句子的依存结构信息,导致对句子的语义理解能力有限。此外,由于依赖依存结构信息的术语抽取方法存在分词或依存结构错误,导致术语抽取准确性和完整性不佳。为解决上述问题,该文提出一种基于依存结构学习的中学数学术语鲁棒抽取模型。模型利用预训练模型得到文本向量语义表示,并借助带有去噪注意力机制层的图神经网络和双向循环神经网络分别捕获文本的依存结构信息和上下文信息,进一步采用注意力机制融合文本结构信息和上下文信息以实现在融入依存结构信息的同时缓解错误分词或依存结构的影响。模型在自建的中学数学术语数据集上抽取精度P和F1值分别达到了83.82%、82.51%,相较于基准模型分别提升了2.21%、1.22%,表明该文所提方法能够鲁棒融合依存结构信息,从而提升中学数学术语抽取的精确性和完整性。Term extraction methods in middle school mathematics do not consider the dependency structure information of the sentence,which leads to a limited semantic understanding of the sentence.In addition,the term extraction method of dependency structure information exists some errors in dependency structures,resulting in poor accuracy and completeness.This paper proposes a robust extraction model for middle school mathematical terms based on dependency structure learning.The dependency structure information and context information of text is captured by the graph neural network model with a denoising attention mechanism layer and bidirectional recurrent neural network,respectively.The attention mechanism is further used to integrate text structure information and context information to integrate the dependency structure information while alleviate the influence of incorrect word segmentation or dependency structure.The proposed model achieves 83.82%precision and 82.51%and F_1 value in the experiment,indicating 2.21%and 1.22%improvements compared with the baseline model,respectively.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.13