自适性语言测试题库CTT与IRT参数估计对比研究  

A Comparative Study on CTT and IRT Parameter Estimations for CAT Question Pools

在线阅读下载全文

作  者:修美丽[1] 柴省三[2] 鲍杰 Xiu Meili;Chai Xingsan;Bao Jie

机构地区:[1]对外经济贸易大学国际学院 [2]北京语言大学国际学生教育政策与评价研究院

出  处:《首都师范大学学报(社会科学版)》2024年第3期180-189,共10页Journal of Capital Normal University:Social Science Edition

基  金:国家社科基金重点项目(17AYY011);北京语言大学重大基础研究专项(中央高校基本科研业务费专项资金)(19ZDJ04);北京语言大学一流学科团队支持计划(2023YJC02)阶段性成果。

摘  要:在计算机自适应性(CAT)与评价中,题库是测试系统实现的基础,其中题目参数估计质量是决定题库建设的核心和必要条件。研究以22582名中国汉语水平考试(HSK)考生的实测大数据为基础,采用分层随机抽样法,对获得的8个不同容量的被试样本进行了CTT和IRT参数的估计及比较研究。结果发现,在样本分布同质性前提下,当样本规模在500以内时,CTT与IRT的项目难度参数、区分度参数之间一致性较差;项目的区分度参数稳定性不高;考生能力参数之间存在显著相关性。在远程自适应性语言测试的题库建设中,建议采用大样本IRT参数估计方案。

关 键 词:计算机自适应性考试 题库参数估计 教育测量 语言测试 CTT与IRT理论 

分 类 号:H09[语言文字—语言学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象