检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]浙江大学
出 处:《中国外语》2018年第2期72-81,共10页Foreign Languages in China
基 金:教育部考试中心“中国英语能力等级量表建设研究项目”的研究成果;教育部哲学社会科学研究重大课题攻关项目“中国英语能力等级量表建设研究”(15JZD049);中央高校基本科研业务费资助
摘 要:本文首先介绍了中国英语听力能力等级量表在理论框架、描述语来源、典型任务确定、描述语量表化等方面相对于国外量表和标准的几大突破,在此基础上介绍了一项采用多级计分IRT模型分析学生自我评价数据的较大规模效度验证研究。结果显示:(1)在模型拟合度方面,多元计分IRT模型中的等级反应模型拟合度最好,优于广义分部评分模型与分部评分模型;(2)听力描述语区分度很好,能有效地区分不同能力水平的英语学习者听力能力;(3)听力描述语的难度值在不同样本、不同分析模型、不同校准方法中均能保持稳定性与一致性。This study aims to present some breakthroughs of the listening subscale of China's Standards of English, as compared to some international standards and frameworks, in terms of theoretical framework, sources of descriptors, typical activities, scaling of descriptors, etc., and report a relatively large-scale validation study in which polytomous IRT models are used to scale the selfassessment data. The results show that:(1) among the three polytomous IRT models, the graded response model fits the data better than the generalized partial credit model and partial credit model in terms of model-data fit;(2) the descriptors have good discrimination parameter estimates, indicating that they work well in discriminating EFL learners' listening ability;(3) the descriptors have medium difficulty parameter estimates, which remain stable across different samples, different IRT models and different calibration methods.
关 键 词:英语听力能力等级量表 效度验证 自我评价 多级计分IRT模型
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.14.64.102