基于依存结构学习的中学数学术语鲁棒抽取  

Dependency Structure Learning for Robust Extraction of Middle School Math Terms

在线阅读下载全文

作  者:罗凯威 罗文兵[1,2] 黄琪 王明文[1,2] LUO Kaiwei;LUO Wenbing;HUANG Qi;WANG Mingwen(School of Digital Industry,Jiangxi Normal University,Shangrao,Jiangxi 334000,China;School of Computer and Information Engineering,Jiangxi Normal University,Nanchang,Jiangxi 330022,China)

机构地区:[1]江西师范大学数字产业学院,江西上饶334000 [2]江西师范大学计算机信息工程学院,江西南昌330022

出  处:《中文信息学报》2023年第8期75-85,共11页Journal of Chinese Information Processing

基  金:国家自然科学基金(62266023);江西省教育厅研究生创新基金项目(YC2022-s348);江西省教育厅科学技术研究项目(GJJ210325,GJJ2200354)。

摘  要:中学数学术语抽取方法未考虑句子的依存结构信息,导致对句子的语义理解能力有限。此外,由于依赖依存结构信息的术语抽取方法存在分词或依存结构错误,导致术语抽取准确性和完整性不佳。为解决上述问题,该文提出一种基于依存结构学习的中学数学术语鲁棒抽取模型。模型利用预训练模型得到文本向量语义表示,并借助带有去噪注意力机制层的图神经网络和双向循环神经网络分别捕获文本的依存结构信息和上下文信息,进一步采用注意力机制融合文本结构信息和上下文信息以实现在融入依存结构信息的同时缓解错误分词或依存结构的影响。模型在自建的中学数学术语数据集上抽取精度P和F1值分别达到了83.82%、82.51%,相较于基准模型分别提升了2.21%、1.22%,表明该文所提方法能够鲁棒融合依存结构信息,从而提升中学数学术语抽取的精确性和完整性。Term extraction methods in middle school mathematics do not consider the dependency structure information of the sentence,which leads to a limited semantic understanding of the sentence.In addition,the term extraction method of dependency structure information exists some errors in dependency structures,resulting in poor accuracy and completeness.This paper proposes a robust extraction model for middle school mathematical terms based on dependency structure learning.The dependency structure information and context information of text is captured by the graph neural network model with a denoising attention mechanism layer and bidirectional recurrent neural network,respectively.The attention mechanism is further used to integrate text structure information and context information to integrate the dependency structure information while alleviate the influence of incorrect word segmentation or dependency structure.The proposed model achieves 83.82%precision and 82.51%and F_1 value in the experiment,indicating 2.21%and 1.22%improvements compared with the baseline model,respectively.

关 键 词:术语抽取 依存结构 图神经网络 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象