数据分析报告自动评分研究  

在线阅读下载全文

作  者:夏稳 宋捷[1] 

机构地区:[1]首都经济贸易大学统计学院,北京100070

出  处:《科技与创新》2023年第4期16-20,共5页Science and Technology & Innovation

基  金:2021年首都经济贸易大学校内专项校级教改立项重点项目“数据分析报告自动评分与以评促学的教学实践研究”(编号:592254203015)。

摘  要:为了实现没有标准答案及确定主题的数据分析报告的自动评分算法,利用文本分词等技术将数据分析报告处理为结构化数据,量化评分特征利用机器学习模型学习评分过程,找出重要特征变量,从而完成数据分析报告自动评分算法的实现。实验结果表明,使用随机森林的MPE约为3.85,优于3种主要的对比模型,最重要的特征变量是工作变量和描述性变量。没有把人工打分考虑的非语义因素纳入模型,可能导致机器自动评分和人工打分的结果存在差异。利用自然语言处理技术和机器学习模型,在没有标准答案对比及确定主题分析的前提下,实现了数据分析报告的自动评分且评分结果和人工评分结果差异不大。

关 键 词:数据分析报告 自动评分 文本分词 随机森林 

分 类 号:TP311.52[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象