国际中文教育的语言测评理论与实践

国际中文教育的语言测评理论与实践
作者: 张军|
出版社: 研究
原售价: 49.00
折扣价: 28.91
折扣购买: 国际中文教育的语言测评理论与实践
ISBN: 9787519916565

作者简介

内容简介

3 实验研究 3.1 目的 采用CMIRT模型,探索性地分析HSK阅读部分的潜在 维度结构。通过比较维度数从二到六这五个模型,看几 维模型更拟合数据。 3.2 对象 从在复旦大学、南开大学、外企等11个国内考点, 参加2005年12月HSK [初中等]考试的12098名被试中随 机抽取4924人。被试总体的平均分为100.0分,标准差 为33.714,呈正态分布。为保证样本对总体的代表性, 根据正态分布规律,实验依据被试的试卷总分分层抽样 。被试样本平均数为98.8,标准差为31.33,经T检验后 样本平均数与总体平均数无显著差异,P>0.05。 3.3 材料 HSK[初中等]正式试卷的阅读题部分,试卷代码为 M05N09X,从第81题到第130题,共计50个题。每题采用 0/1计分,即答对为1分,答错为0分。 3.4 参数估计方法 本研究使用联合极大似然估计法,采用Visual Foxpro9.0来编写程序:第一步:预先给暂不估计的参 数设置初值,以0.01为步长,将待估参数取值范围中所 有的数值逐步代入函数,得到能使函数值最大的数值作 为参数估计值。然后将已估参数的估计值和其他暂不估 计的参数初值作为定值,如同第一步,继续估计第2个 待估参数。第二步:重复第一步,直至估计完所有待估 参数。鉴于以往的估计经验,估计参数的顺序为:难度 值、能力值1、区分度1、能力值2、区分度2……直至估 计完所有待估参数,完成第一次迭代估计。第三步:重 复第一次迭代中的各步骤,完成第二次、第三次等多次 迭代,直至得出符合收敛要求的参数值。实验采取的收 敛要求为:(1)最后一次和它前一次的估计结果的相 关系数达到0.99以上;(2)分别把最后两次参数值代 入,求解所有被试对所有项目的反应的两次联合对数似 然概率,二者间的差值小于20,即两次的联合似然概率 的差值小于0.000000002。 3.5 拟合优度检验方法 研究主要采用项目间协方差相关矩阵、残差分析和 卡方检验三种方法。第一种方法我们可根据Reckase (1985)和Segall(2000)的建议,用任意题目对的协 方差的大小来推断观测数据与模型预测所得期望概率间 的拟合程度。研究者经常采用残差分析与卡方检验检验 单维IRT模型的拟合优度。在单维IRT 的残差分析中, 通常按照已估能力值把被试分成若干组。但MIRT中我们 似乎不能单纯按其中某一维度的能力值分组,因为被试 的能力由多个维度构成,无论以哪一个维度来给被试分 组的做法都是较盲目的,都不能保证组内被试的同质性 。给被试分组实质上是一个分类问题。我们得到参数的 估计值后,就能知道被试在潜在维度构成的多维空间中 的位置,所以本研究在遵循有关检验思路的同时,对具 体操作做了相应的灵活处理,在多维空间中按照几个维