高分组英语写作文本的句法特征探究——基于句酷批改网英语写作文本的数据挖掘  被引量:9

Exploring Syntactic Characteristics of Advanced English Writing Texts——Based on Data Mining the Essays from Pigai

在线阅读下载全文

作  者:何欣忆 黎曜玮 李良炎[1] 邹晓玲[1] 张小洪[2] HE Xin-yi;LI Yao-wei;LI Liang-yan;ZOU Xiao-ling;ZHANG Xiao-hong(School of Foreign Languages and Cultures,Chongqing University,Chongqing,China 400044;School of Big Data and Software Engineering,Chongqing University,Chongqing,China 400044)

机构地区:[1]重庆大学外国语学院,重庆400044 [2]重庆大学大数据与软件学院,重庆400044

出  处:《现代教育技术》2018年第12期74-79,共6页Modern Educational Technology

基  金:重庆大学教学改革研究项目"基于翻转课堂的大学英语翻译教学模式创新研究"(项目编号:2016Y06)的阶段性研究成果之一

摘  要:文章从句酷批改网抽取了非英语专业大学生英语议论文写作文本2300篇,采用二语句法复杂度分析器分析,进一步使用随机森林和逻辑回归机器学习算法探究高分组学生在句法层面的重要写作特征。研究发现:基于二语句法复杂度,使用随机森林和逻辑回归对高分组学生作文机评分数预测的准确率较高,高分组学生的写作文本在单位长度、句子复杂度和特定短语结构三大类句法复杂度上具有突出表现,其中最显著的五项句法特征是平均句长、平均每句所含子句量、平均子句长度、每个主从句中的动词短语量和每个子句中的复杂名词性短语量。文章的研究结果可以为提高英语写作教学水平和改进写作机评系统提供参考。The study extracts 2,300 English writing texts from non-English major college students based on www.pigai.org,and uses Second Language Syntactic Complexity analyzer(L2SCA)to further explore the significant syntactic characteristics of advanced writing texts via Random Forest and Logistic Regression machine learning algorithms.The study found that the accuracy of using random forest and logistic regression to predict the syntactic characteristics of advanced writing texts can reach 84.9%and 93.4%,respectively.The advanced writing texts are syntactically characterized by unit length,sentence complexity and specific phrase structure.Finally,the research hopes to shed light on English writing teaching,learning and improvement of automated writing evaluation system.

关 键 词:高分组英语写作 二语句法复杂度 句法特征 

分 类 号:G40-057[文化科学—教育学原理]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象