检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:王耀华[1] 李舟军[1] 何跃鹰[2] 巢文涵[1] 周建设[3]
机构地区:[1]北京航空航天大学计算机学院,北京100191 [2]国家计算机网络应急技术处理协调中心,北京100029 [3]首都师范大学成像技术高精尖创新中心,北京100048
出 处:《中文信息学报》2016年第6期173-181,共9页Journal of Chinese Information Processing
基 金:国家自然科学基金(61170189;61370126;61202239;U1636211);国家863计划(2015AA016004;2014AA015105);北京成像技术高精尖创新中心项目(BAICIT-2016001)
摘 要:该文尝试从文本语义离散度的角度去提升自动作文评分的效果,提出了两种文本语义离散度的表示方法,并给出了数学化的计算公式。基于现有的LDA模型、段落向量、词向量等具体方法,提取出四种表征文本语义离散度的实例,应用于自动作文评分。该文从统计学角度将文本语义离散度向量化,从去中心化的角度将文本语义离散度矩阵化,并使用多元线性回归、卷积神经网络和循环神经网络三种方法进行对比实验。实验结果表明,在50篇作文的验证集上,在加入文本语义离散度特征后,预测分数与真实分数之间均方根误差最大降低10.99%,皮尔逊相关系数最高提升2.7倍。该表示方法通用性强,没有语种限制,可以扩展到任何语言。Based on the existing methods,including LDA model,paragraph vector,word vector text,we extract four kinds of text semantic dispersion representations,and apply them on the automatic essay scoring.This paper gives a vector form of the text semantic dispersion from the statistical point of view and gives a matrix form from the perspective of decentralized text semantic dispersion,experimented on the multiple linear regression,convolution neural network and recurrent neural network.The results showed that,on the test data of 50 essays,after the addition of text semantic dispersion feature,the Root Mean Square Error is reduced by 10.99%and the Pearson correlation coefficient increases 2.7times.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.249