第一图书网

计算机辅助教育测量与评价

蔡F君,刘仁云 主编 水利水电出版社
出版时间:

2010-6  

出版社:

水利水电出版社  

作者:

蔡F君,刘仁云 主编  

页数:

232  

前言

教育基本理论研究、教育测量与评价科学研究和教育发展理论研究已成为现代教育科学研究的三大领域。当代,教育测量与评价的研究成果被广泛应用于教育事业和教育活动的各个方面。教育督导工作离不开它,学校管理工作离不开它,教育决策也离不开它,人才选拔与录用更是离不开它。随着教师教育改革的不断深入发展,越来越多的教育决策者、研究者、管理者和教师对这一领域都表现出极大的兴趣和关注,而这正是教育测量和评价实践与研究的生命源泉。计算机技术和教育测量与评价思想的融合引发了评价内容、方法和形式的深刻变革。从经典测验到项目反应理论、从常模参照测验到标准参照测验、从学业成就到能力素质测验、从终结性评价到形成性评价,都有应用计算机辅助评价的案例。显然,传统的教育测量与评价教材已不能完全适应新技术发展的要求。如何将计算机辅助评价的思想与技术进行梳理并加以整合、系统介绍是当前教育测量与评价研究的一项工作。应此需要,我们在这方面做了一些尝试,通过群力合作完成了这部《计算机辅助教育测量与评价》。依据计算机技术的特性,将计算机化搜集信息、计算机化处理信息和计算机化评价信息的功能融入各个章节,通过对教育测量与评价理论、方法和技术的加工整理,形成了统计软件——计算机测试——计算机化阅卷的设计思路。

内容概要

为适应计算机及其软件的日益普及,及对教育领域测量与评价手段韵影响,本书改变以往教育测量与评价教科书单纯地讲解测量原理与方法的缺陷,将各种评价信息搜集、整理后,在应用统计分析的方法时与相应的计算机统计软件结合起来介绍,然后用具体案例的分析示范和统计软件的使用说明,成为一体化的内容。 在介绍社会学研究领域广为流行的SPSS软件(含Amos)应用的基础上,介绍S-P表综合评价、计算机自适应测验、技能性测评与网络化评价,以及计算机自动评分等计算机辅助评价的具体应用。

书籍目录

前言第1章 计算机辅助教育测量与评价概述 1.1 教育测量与评价的产生  1.1.1 教育测验的兴起  1.1.2 美国的教育测验运动  1.1.3 “八年研究”与教育评价的诞生 1.2 计算机辅助评价的定义与分类  1.2.1 计算机辅助评价(CAA)的定义  1.2.2 计算机辅助评价(CAA)的分类 1.3 计算机辅助评价的发展  1.3.1 从经典测验(CTT)到项目反应理论(IRT)  1.3.2 从常模参照测验到标准参照测验  1.3.3 从学业成就到能力素质测验  1.3.4 从终结性评价到形成性评价 1.4 第四代教育评价的兴起  1.4.1 第四代教育评价的内涵  1.4.2 第四代教育评价的主要方法  1.4.3 将评价融入学习环境的设计 习题第2章 教育测量与评价的基本原理 2.1 教育测量与评价的基本问题  2.1.1 教育测量及其数据类型  2.1.2 教育评价及其标准  2.1.3 教育评价的类型  2.1.4 我国两种基本的教育评价制度 2.2 教育评价对象的抽样技术  2.2.1 抽样的方法  2.2.2 样本数量的确定 2.3 教育评价指标体系的设计  2.3.1 指标体系的设计  2.3.2 指标体系权集的确定  2.3.3 聚类分析及其SPSS操作 2.4 教育评价资料的搜集与分析  2.4.1 教育评价资料搜集的方法  2.4.2 教育评价资料分析的方法 习题二第3章 教育测量与评价的质量分析 3.1 信度  3.1.1 同质性信度  3.1.2 分半信度  3.1.3 再测信度  3.1.4 评分者的信度 3.2 效度  3.2.1 内容效度  3.2.2 结构效度  3.2.3 因素分析的SPSS操作  3.2.4 验证性因素分析的应用例举  3.2.5 效标关联效度  3.2.6 效度与信度的关系 3.3 难度  3.3.1 难度系数的计算办法  3.3.2 难度的转换  3.3.3 难度对测验的影响 3.4 区分度  3.4.1 区分度的意义  3.4.2 区分度的计算  3.4.3 区分度对测验的影响 习题三第4章 测验分数等值及其常模量表的建立 4.1 测验分数等值及其常模  4.1.1 测验等值的含义  4.1.2 测验分数等值的方法  4.1.3 常模 4.2 百分等级常模的建立  4.2.1 百分等级常模的意义  4.2.2 百分等级常模的建立方法 4.3 标准分数常模的建立  4.3.1 标准分数的定义  4.3.2 标准分数常模的建立方法 习题四第5章 测验分数的描述统计 5.1 频数分布  5.1.1 数据的基本类型  5.1.2 频数分布表  5.1.3 频数分析的SPSS例解  5.1.4 频数分布图的SPSS操作  5.1.5 运用SPSS对多选题的描述统计 5.2 样本的数字特征  5.2.1 数据分布的集中趋势  5.2.2 数据分布的离散程度  5.2.3 数据分布的形态  5.2.4 计算样本数字特征的SPSS例解 习题五第6章 教育评价信息的推断性统计 6.1 统计量的分布  6.1.1 总体的描述  6.1.2 样本均值的分布  6.1.3 样本方差的分布  6.1.4 t统计量  6.1.5 F统计量 6.2 参数估计  6.2.1 参数点估计  6.2.2 参数区间估计 6.3 参数假设检验  6.3.1 假设检验的基本原理  6.3.2 假设检验的几个基本概念  6.3.3 单总体的Z检验和t检验  6.3.4 两总体的t检验 6.4 非参数检验  6.4.1 X2检验  6.4.2 单一样本K-S检验  6.4.3 两个独立样本的非参数检验  6.4.4 两个相关样本的非参数检验 习题六第7章 教育评价信息的方差分析 7.1 方差分析的基本原理  7.1.1 方差分析概述  7.1.2 方差分析的基本原理  7.1.3 方差分析的假设检验  7.1.4 因素的主效应和因素之间的交互作用  7.1.5 协方差分析 7.2 方差分析的基本过程  7.2.1 SPSS方差分析过程简介  7.2.2 完全随机设计的单因素方差分析  7.2.3 两因素方差分析  7.2.4 相互关联的多因变量方差分析  7.2.5 重复测量实验设计的方差分析 7.3 方差秩分析  7.3.1 独立样本的方差秩分析  7.3.2 相关样本的方差秩分析 习题七第8章 标准参照测验及其鉴定 8.1 标准参照测验及其分数解释  8.1.1 标准参照测验的含义  8.1.2 标准参照测验与常模参照测验的联系和区别  8.1.3 标准参照测验分数的解释 8.2 标准参照测验分界分数线确立的方法  8.2.1 判断法  8.2.2 判断经验法  8.2.3 经验判断法 8.3 标准测验的有效性分析  8.3.1 测题质量评定  8.3.2 测验信度的估计  8.3.3 测验效度的分析 8.4 计算机程序化S-P表综合评价  8.4.1 S-P表的基本概念  8.4.2 S-P表的特点  8.4.3 S-P表的生成过程  8.4.4 S-P表的应用分析 习题八第9章 项目反应理论及其应用 9.1 项目反应理论概述  9.1.1 项目反应理论的产生  9.1.2 项目反应理论的含义  9.1.3 项目反应理论的发展  9.1.4 项目反应理论基础模型例举 9.2 项目反应模型的参数估计  9.2.1 项目参数已知的能力参数估计  9.2.2 联合极大似然估计 9.3 项目和测验的信息函数  9.3.1 项目信息函数  9.3.2 测验信息函数  9.3.3 项目反应理论参数计算软件IRTP简介 9.4 项目反应理论的应用  9.4.1 题库建设  9.4.2 题目参数等值  9.4.3 标准参照性测验的编制 习题九第10章 计算机辅助教育测量与评价应用例举 10.1 计算机自适应测验  10.1.1 计算机自适应测验的意义  10.1.2 计算机自适应测验的原理  10.1.3 计算机自适应测验的实现条件与施测程序  10.1.4 计算机自适应测验的编制步骤及策略  10.1.5 基于MET-CATS系统的自适应测试 10.2 技能性测评与网络化评价  10.2.1 IT技能性测评  10.2.2 网络化评价  10.2.3 国家普通话水平智能测试系统简介 10.3 计算机化阅卷  10.3.1 电子阅卷  10.3.2 网上评卷  10.3.3 计算机自动评分 习题十附录

章节摘录

插图:第一代教育评价被称为教育评价的“测量时代”,这一时代从1900年到1930年。主要标志是测量理论的形成和测量技术手段的大量应用,以追求评价结果的数量化、客观化为主要目的。第二代教育评价从1930年到1940年。第二代教育评价的主要特征是对评价结果进行描述。这个时期的评价目标已不再只是学生本身,而是考虑什么样的学习目标、学习模式对学生最为有效。测量仍然是重要工具,但它不再是唯一的工具了。评价者由原来的“测量技术员”变成了“描述者”。因此,第二代教育评价也被称为教育评价的“描述时代”。第三代教育评价被称为教育评价的“判断时代”,大约从1950年前后开始,到20世纪60年代初期。这一代教育评价的特点,是把前两代没有涉及到的“价值判断”引进了教育评价,并视之为教育评价的关键,评价者的任务不仅是要运用一定的测量手段搜集评价信息,而且还要制定判断价值的目标与评价标准,运用一定手段进行价值判断。通过对前三种评价理论构建的反思,他们认为,前三代评价理论的不足之处是,一方面把评价对象及其他一切有关的人都排除在外,不予考虑,致使评价工作不够全面,不够深入;另一方面是把评价者的价值作为评价的唯一标准,没有考虑到评价中其他人的价值观念。同时,在评价方法上忽视了定性方法的运用。在他们看来,“评价描述的并不是事物真正的、客观的状态,它表示的仅是参与评价的每个人或团体(包括评价委托人、评价者、评价对象及其他有关的人)关于评价对象的一种主观认识。评价的结果就是这些人基于这种认识整合而成的一种共同的、公认的看法。评价活动所发现的事实,也不是那种终极意义的事实,究其本质,它只不过是一种心理‘构建物”’。


编辑推荐

《计算机辅助教育测量与评价》:21世纪高等院校创新精品规划教材

图书封面

广告

下载页面


计算机辅助教育测量与评价 PDF格式下载



书的质量不错,很精美


相关图书