中国英语听力能力等级量表描述语效度验证——基于学生自我评价的多级计分IRT模型分析  被引量:31

Validation of Listening Descriptors of China’s Standards of English: An Analysis of Self-assessment Data Using Polytomous IRT Models

在线阅读下载全文

作  者:闵尚超[1] 何莲珍[1] 罗蓝 

机构地区:[1]浙江大学

出  处:《中国外语》2018年第2期72-81,共10页Foreign Languages in China

基  金:教育部考试中心“中国英语能力等级量表建设研究项目”的研究成果;教育部哲学社会科学研究重大课题攻关项目“中国英语能力等级量表建设研究”(15JZD049);中央高校基本科研业务费资助

摘  要:本文首先介绍了中国英语听力能力等级量表在理论框架、描述语来源、典型任务确定、描述语量表化等方面相对于国外量表和标准的几大突破,在此基础上介绍了一项采用多级计分IRT模型分析学生自我评价数据的较大规模效度验证研究。结果显示:(1)在模型拟合度方面,多元计分IRT模型中的等级反应模型拟合度最好,优于广义分部评分模型与分部评分模型;(2)听力描述语区分度很好,能有效地区分不同能力水平的英语学习者听力能力;(3)听力描述语的难度值在不同样本、不同分析模型、不同校准方法中均能保持稳定性与一致性。This study aims to present some breakthroughs of the listening subscale of China's Standards of English, as compared to some international standards and frameworks, in terms of theoretical framework, sources of descriptors, typical activities, scaling of descriptors, etc., and report a relatively large-scale validation study in which polytomous IRT models are used to scale the selfassessment data. The results show that:(1) among the three polytomous IRT models, the graded response model fits the data better than the generalized partial credit model and partial credit model in terms of model-data fit;(2) the descriptors have good discrimination parameter estimates, indicating that they work well in discriminating EFL learners' listening ability;(3) the descriptors have medium difficulty parameter estimates, which remain stable across different samples, different IRT models and different calibration methods.

关 键 词:英语听力能力等级量表 效度验证 自我评价 多级计分IRT模型 

分 类 号:H319[语言文字—英语]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象