检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:黄林嘉 肖菁[1] 曹阳[1] HUANG Linjia;XIAO Jing;CAO Yang(School of Computer Science,South China Normal University,Guangzhou,Guangdong 510631,China)
机构地区:[1]华南师范大学计算机学院,广东广州510631
出 处:《中文信息学报》2023年第2期148-157,共10页Journal of Chinese Information Processing
基 金:国家自然科学基金(62177015);国防科技重点实验室稳定支持经费项目(WDZC20205250410)。
摘 要:近几年,数学应用题自动解答(Math Word Problems,MWP)的研究受到越来越多学者关注,大多数研究的重点是对编码器的改进。然而目前的研究在编码器的改进方面还存在以下问题:(1)输入文本的颗粒度一般是字级别,这会导致泛化能力不足;(2)大多数模型对文本信息的挖掘没有充分利用文本内实体、词性等信息,只是停留在时序信息层面。该文针对以上问题,在双向GRU(Gated Recurrent Unit)的基础上提出了一种新颖的基于多粒度分词和图卷积网络的编码器结构(Multi-grained Graph Neural Networks,MGNet)。多粒度分词是通过对文本的每个词进行不同颗粒度的分词,增加了样本容量,并且通过引入一些噪声样本,提高了模型的泛化能力。图卷积神经网络通过构建文本内实体、数字、日期之间的不同的属性图,对它们之间隐含的关系进行建模。在Math23K和Ape210K数据集的实验显示,该文提出的模型MGNet准确率分别达到77.73%和80.8%。In recent years,the task of automatically solving Math Word Problems(MWP)has received more and more attention and most of researchers focused on improving the encoders.The issues in current encoders include:(1)The input granularity is character level and it will cause insufficient generalization ability;(2)Only the text sequence is modeled without capturing the entities,part of speech and other textual information.To alleviate the above issues,this paper proposes a novel encoder structure based on multi-grained word segmentation and graph convolution(MGNet)using the bidirectional GRU(Gated Recurrent Unit).The multi-grained word segmentation increases the sample capacity by segmenting the text with different granularities and improves the generalization ability of the model by introducing some noise samples.The graph convolutional neural networks can learn the implicit relationship among name entities,numbers and dates by constructing different attribute graphs among them.Experiments on two public benchmarks Math23K and Ape210K datasets show that our proposed MGNet can achieve the accuracy of 77.73% and 80.8% respectively.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.188.103.42