考试测评与创新
【  发布时间:2016-05-23  】  【打印

---国际考试行业协会(ATP)第17届年会情况简介

一、本届年会概况与亮点

1.参会人数创新高

由国际考试行业协会(Association of Test Publishers,简称ATP)主办的ATP17届年会,于2016320日至323日在美国佛罗里达州奥兰多市举行。来自全球20多个国家的1,163名考试测评行业代表参加了本次年会,创下历史新高。他们分别来自考试行政管理部门、教育机构、考试主办方、技术服务商和测评机构等单位。国内共有6家考试和人才测评机构派代表参加了年会。作为ATP会员,财政部会计资格评价中心也派代表参加了本次年会。年会参会人员及构成详见下图。

2.会议关注的热点

会议围绕考试中的创新主题,议题覆盖了考试与人才测评相关的理论与技术等内容。

年会在分会场举办了多种形式的演讲及互动讨论133场,展览活动36场,共计169场。

从演讲和互动的内容看,本届年会关注的热点主要有5个方面:考试安全,包括试题、考试与考生隐私安全等问题;试题开发与运用,包括题型题量、命题方式方法,以及自适应考试等问题;考试测评软件开发与运用,包括题库软件、考试软件、考试形式等问题;人才测评,包括招聘与人才测评、员工能力测评、培训与继续教育等问题;其他,包括考试的商业运作、考试的推广、业务策略与经营等问题。

3.会议的亮点

与往年年会相比,第17ATP年会增加了数字海报展览环节、增设了公开讨论环节、提供了分论坛的网络直播与录制视频,除原有两大年度奖项外,今年还增设了ATP年度全球风云人物”奖。

北京师范大学心理学教授兼ATP亚洲分会理事张厚粲女士荣获“ATP2016年度全球风云人物”奖。

除开幕演讲、闭幕演讲外,各类分会场等活动办得有声有色,主要包括:

专题演讲(Breakouts88场,是由一名或一组演讲者以演讲并接受提问的模式进行的主题演讲,其中包括铂金赞助商演讲、特邀嘉宾演讲及其他专题演讲。

工作坊(Workshops18场,是较专题演讲时间更长且内容更为深入的演讲,同时安排更多的互动环节。

点火演讲和讨论(Ignite Presentations and Discussions6场,是指以一段较短演讲引出话题后,由听众参与共同进行该话题的讨论。

鱼缸讨论(Fishbowl Discussions8场,则是演讲间隙进行的多话题讨论。

豆荚讨论(Peas in a Pod13场,是今年第一次推出的新的会议形式,是指完全开放式的非正式交流,目的在于为参会者提供更多互相交流学习的机会和场所,发现彼此共同点。

产品演示(Product Demonstrations17场,是由技术服务商一对一地进行考试软件、题库软件等考试相关产品的计算机演示。

另外,还有数字海报(E-Poster Sessions19场。

我们参加了14场演讲与互动,现摘译其中的几个精彩片段。

二、精彩演讲节选

1.演讲标题:适应现实变革的自适应考试

主讲人:来自NCSBNAda Woo,来自NCCPA(助理医师考试)Andrew Dallas6人。

.研究表明,模块式开发往往比题池中零散地存放试题更容易实现测试目标,更便于对考试内容的直接控制。相比传统考试,ca-MST提供更高的分类精度和较低的评估误差。下一步需要研究的问题是,在保证理想精度的前提下,MST考试可以减少多少测试试题,以及题库的适应性问题。

CAT的目标是让考试测评有用信息最大化,在考前必须了解试题属性并设置项目参数, 系统根据考生对先前试题答题情况和已知项目参数评估,选择下一道试题,能力高的考生会少做些容易的题,能力低的考生会少做些难题。

CAT测试在设计时,首先,要确保考试符合测试规范和项目选择的运算程序,其次,在测试规范许可的范围内划定内容区域的最大偏离边界,再从该内容区域中选择适当的难度级别来管理下一个测试项目。经过对一道道试题的选择,考生的能力被大致锁定在一个幅度内,这样就能使考试评价的误差越来越小。

.实践研究表明,自适应考试能够提高考试精确性,减少对试题数量的要求。

2.演讲标题:在快速变化的大纲下如何保持考试稳定

主讲人:来自PAEADonovan Lessard,来自NCCPAAndrew Dallas4人。

.以NCCPA为例,从医师助理专业的发展历史可看考试的变化性及专业化,变化的是内容,不变的是专业性。

.考试内容变更,需要考虑的问题很多。在具体操作时,往往需要考虑各州的法律差异和现实的可行性,明确分类规则,对考试内容进行重新分类,确定试题难度,编写操作指南,重新审核题库中的试题。另外,随着新技术试题的应用(多媒体)、新题型的开发,伴随新的解决方法会产生的新的挑战。

.考试内容更新过程中要考虑细目表的稳定性,考试的公平性和实现性。我们既要保持考试稳定性,在某种意义上讲其重要性要远远大于内容更新,同时又要考虑如何保证考试在工作领域的运用,即随着实践的变化而变化。

3.演讲标题:从计算机考试到便携式设备考试--曲解、含义及陷阱

演讲者:BDO Belgium公司的Michael Tack4

.智能手机和平板电脑的保有量不断增加,让考试管理机构思考如何通过这种设备来进行考试。

.通过电脑和便携式设备所得数据可能会有不同,这种不同可能会影响通过便携式设备来进行考试的可能性,此外,便捷式设备除了可以被用作考试设备外,还可以被用于现实工作预演等领域。

.考试管理机构应该考虑究竟使用便携式设备进行考试能为考生带来什么,是真正的测量方式、测量内容的革新,还是仅仅只是屏幕的大小不同而已,只有真正能促使考试进步的进程才有必要进行推进。

.从纸笔考试到无纸化考试,是改变考试领域基础性的变革,无纸化考试实现了很多纸笔考试时代不可能的考试形式,如自适应考试等,如果从计算机考试到便携式设备考试也能为考试带来更优的测量手段,那么推进便携式设备考试进程则很有必要。

4.演讲标题:考试安全与大数据

演讲者:ACT公司的Deb HarrisCFA学院的Patrick WattsWisconsin-Madison大学的James Wollack

.考试安全专家已经不满足于仅仅通过算法的微调来获得对数据更深层次的理解,而是通过对某些细微异常现象的深入研究,调取相关数据,来充分提升这部分数据的价值。

.如何筛选数据中无用的信息,将有限资源配置到最需要的地方,并以此提高考试系统架构的安全才是考试安全应关注的重点。而大数据在考试安全方面的应用,不应该仅仅只是对某个或某几个数据样本的使用,而是对全部数据的统筹及利用。

5.演讲标题:职业技能认证的坏消息与好消息

演讲者:来自NTT TrainingDan Rinn;来自Head Held HighMadan Padaki

.各国的职业认证考试机构都在努力推进考试测评的专业开发,提高管理质量。

.正确的、已验证的职业技能(资格)证书,能够为人们的生活与商业活动带来许多益处。

.不仅仅是专业技能,某些“软性技能”在职业认证领域也变得越来越重要。

 

(作者及单位:朱海林 金荣华 王珍霖  尹航,财政部会计资格评价中心,

本文在《考试研究》2016年第3期上刊载)