移花接木:试论题库与阅卷系统嫁接的必要
【摘要】与纸质教辅相比,市场化通用题库最大的优势是对针对性教学的辅助作用。但现实中,语义技术尚未真正应用,在线测试难以实现、主观题批阅困难、用户使用出现问题等原因导致题库优势难以真正发挥。阅卷系统与题库系统的嫁接可在一定程度上解决目前题库存在的问题,起到优化题库的作用。
【关键词】市场化题库;针对性教学;应用方式;阅卷系统
【作者单位】汪琳,安徽教育网络出版有限公司。
纸质教辅占据了传统教育出版的半壁江山,题库作为纸质教辅数字化的存储方式和呈现形式,是在线教育出版必不可少的内容资源和产品应用。此外,题库还有助于教育信息的共享和考试公平,是教育信息化不可或缺的组成部分。早在17世纪,夸美纽斯便指出复习和考试在教学过程中的重要性:“我们的教学法要提供经常的实际复习和测验,即使在学习过程中也应如此……通过指定而未经预演的实践就可显示出来。”[1]复习和考试在基础教育中是绕不过去的教学环节,而题库是实现复习和考试的重要因素之一。
一、针对性教学应用的困境
目前各种题库主要分为两大类型:一是标准化考试题库;二是市场化通用题库。标准化考试题库针对具体的标准化考试设置,应用场景相对单一 ,一般由专门的考试机构建设和维护,具有保密性的特点,更加注重考试的公平性和科学性。市场化通用题库则更多地用于练习、自测,充当资源库。它的应用场景更加多样化,具有学科、学段众多,题库设置复杂,资源海量等特点,对教学起到良好的辅助性作用。菁优网、猿题库等众多在线教育公司建设的题库多属此类题库。标准化考试题库建设和应用已经较为成熟,本文就目前市场化通用题库中的问题,进一步探索其最佳的资源建设方式和应用方式。
相对纸质教辅与试卷的练习和评测,智能题库的辅助性教学除提供试题、试卷资源外,最大的优势是数据分析、学习诊断,以及针对性教学资源的推送。智能题库通过记录、评测和分析用户在线练习或测试的数据,为用户提供诊断结果,进而推送针对性资源,使用户实现教、学的连贯性和针对性,促进高效教学。尽管林林总总的题库公司大多数打着针对性教学的旗号,但针对性资源的推送实现起来困难重重,具体有以下几个原因。
1. 题库本身具有难以克服的缺陷和不足。一方面,题库理论本身不是完美的。就经典测量理论而言,其理论基础是假定无限大的用户数据,这意味着以无限数据为统计基础的测量结果永远只是无限接近标准,而达不到标准。另一方面,数学上的纯粹逻辑难以忽略数据中的偶然性、主观性和片面性。科学从来就不是纯粹的逻辑,摒除理论缺陷,用户答题出错的原因也千差万别,仅凭系统也难以判定错误类型。当题目涉及多个知识点时,系统更难以定位具体的知识点,从而导致分析出错,无法实现针对性资源的准确推送。
2. 针对性资源推送所依仗的语义技术尚未进入实践应用阶段。语义技术的关键在于知识点的匹配和关联。理科的知识点语义关联目前仍然处于实验室阶段;文科由于知识概念本身的模糊性、争议性和变动性,语义关联更加难以操作。即使语义关联在理论上完成了,它在真正教育实践中的具体运用仍需要长期的摸索和打磨。
3. 针对性资源的推送源于对用户在线练习和检测的数据分析,而事实上,线上测试仍然是题库应用难以突破的难点。一方面,主观题在线答题和批阅难以实现。在线答题的困难主要体现在理科题目上,批阅的困难则在文科题目上显得较为突出。首先,答题中的特殊字符或公式难以处理,公式编辑器的使用对普通用户来说也比较烦琐;其次,即使实现了特殊公式和字符的手写自动输入,平板端或PC端屏幕的限制也会对综合类题目较长的分步骤答题造成干扰;再次,拍照答题的方式在PC端实现起来也比较麻烦,电脑需要与手机或平板端配合,才能实现图片的上传;最后,主观题批阅较为困难,客观题的批改系统可自动识别,但主观题的答题具有多样性特点,系统难以判断。针对这种现象,不少题库公司摒弃了主观题,多采用客观题的形式开展在线练习和检测,但某些知识点和能力的考察存在于特定题型中。这样的数据记录是片面的,数据分析必然会影响诊断结果和标签准确度。也有不少题库公司雇佣教师进行人工批阅,但人工批阅不仅存在人力成本,也很难做到答题的及时反馈。此外,由于现实中师生的教学关系不能带到网络上来,教师也难以了解学生知识的掌握情况,不能对教学做出调整。另一方面,学生练习和自测对周边环境和网络环境的要求相对较低,但如果是班级或学校组织的测试要求则相对较高,大多数学校不能满足在线考试的软硬件环境要求。因此,线下测试在很长一段时间内仍然是主流。
4. 用户使用习惯造成数据分析的可信度不大。针对性资源推送的准确度有赖于数据分析的准确,而数据分析的准确源于大量用户数据的可靠性。要获取可靠数据进行分析,必须要保证用户使用的规模化、连续性和对用户的准确定位。而目前多数题库的用户都处于零散状态,使用也具有突发性的特点,系统难以对用户进行定位。由于在线答题和批阅的不方便,用户对题库的使用也具有偶然性。
二、目前市场化通用题库的应用方式
由于针对性资源推送难以真正实现,目前市场化通用题库在应用上更多地突出其资源库的功能。其具体应用主要有三种方式:资源下载、智能组卷、拍照提问。
资源下载即利用题库中的试卷或单个题目,让老师或者学生根据需要免费或付费下载,这种功能的实现对资源本身的要求较高。基础教育永远应该专注优质的内容资源,在题库建设的起步阶段这无疑是较为明智也较为便捷的选择。菁优网即靠这种对资源的直接应用起家,但这种应用与普通资源平台网站功能类似,无法进一步突出题库特点。
智能组卷则在资源下载的基础上,利用题库经过标引的碎片化试题,为用户提供在线组卷的功能。用户根据需要,从题库中选择不同的题目,组成结构化试卷,并下载、打印或在线推送。智能组卷利用题库特有的功能,满足了部分用户个性化需求。在线推送和分发也由于在线测试和针对性资源推送不能真正实现而变成烂尾工程,数据分析和评测更是无从谈起。
这两种应用方式都需要用户自身能够进行资源甄别或组合,但并非所有用户都具备甄别资源或组建结构化试卷的能力。学生用户不可能在海量题目中去选题做题,家长也无法承担起选题组卷的责任。单纯的系统资源随机推送无法达到结构化推送练习或试卷的标准,一份练习可能会出现雷同题等不合理现象,从而浪费用户的时间和精力。多数老师更倾向于使用现成的结构化试卷或练习,只有当现有的试卷不尽如人意时,老师才会考虑网络资源和应用。
资源甄别和结构化在传统出版中由出版社编辑组织教研员或优秀教师来实现。纸质教辅出版经过多年积累和修订,涉及的地区、版本有限,流程成熟,因此实现起来相对轻松。而市场化通用题库往往面对全国市场,如果要实现有效的练习检测,达到良好的用户体验效果,在课前、课中、课后等各个教学环节都必须针对不同层次的学生和不同版本准备好系统化的优质结构化练习和试卷,以备随时调用,这需要庞大的优秀教师专家队伍和成本支出,尤其在基础教育领域,教材和考纲几乎每年都有不同程度的变动,相关教辅资料也势必要随之变动。近年来,一起作业网加大与传统出版社的合作力度,窃以为,这种举动也是为了在多学科多版本上尽快推出业已打磨成熟的成套的结构化内容资源,降低成本。尽管有人认为网络时代不缺内容,也许难以甄别版权的碎片化资源确实不缺,但优质的结构化内容依然紧缺。
拍照提问是目前题库市场上最火的应用方式。拍照提问是基于手机和平板的客户端应用,其场景设置主要利用课后作业无人辅导的契机,目标群体是学生用户。用户通过手机或平板的摄像头将需要提问的题目拍下上传,系统对照片进行识别,将照片中的题目与题库中的海量题目进行匹配,匹配成功后,将题目的相关信息——主要是答案和解析——调出来推送给用户。如果所提问的题目在题库中没有找到,在线其他用户和老师也可以进行有偿或无偿的解答。系统可为用户提供错题本等功能,还能根据记录的数据提供较为有用的分析评测,让用户对自身知识的掌握情况有一定了解。拍照提问确实能够帮助学生解决一些学习中遇到的困难,但拍照提问为学生用户提供答案和解析的同时,却容易略去学生探究和学习的过程,对真正提高能力、加深对知识的掌握和理解难以起到积极的作用。除提供答案外,系统无法对学生学习进行追踪性辅导。对教师用户而言,这个客户端只是多了个赚取外快的途径,对实际教学并无帮助,现实中的师生关系也不能在线体现,不能保证教学的连贯性和一致性。
以上几种题库应用都以某个教学场景为切入口,满足了教师或学生用户某个教学环节上的需求,但普遍存在教与学分离的情况。学生难以通过题库应用较为完整地完成整个学习过程;教师无法利用题库的分析测评,掌握学生情况,从而开展针对性教学。总体而言,目前市场上的题库系统只完成在线基础教育教学过程中前半截的资源收集、课后练习等环节,而对教学过程中后半截的数据评测、分析和针对性教学帮助不大。
三、题库系统与阅卷系统的嫁接
目前的市场化通用题库应用都体现了扬长避短的努力,但取得突破还需取长补短。市场化通用题库数据分析、针对性教学的优势由于用户使用习惯、在线测试、批阅等种种问题的存在并不能真正实现。而目前市面上通行的阅卷系统在一定程度上解决了这些问题,跟阅卷系统嫁接,也许是题库应用一种值得探索的方式。
线下测试是目前基础教育领域考试的主要方式,但线下测试所涉及的出卷、阅卷和对考试结果的统计分析等环节需要学校和教师投入大量的时间、精力,是教师的沉重负担。教师对考试结果进行的人工评测往往也是粗略的、大而化之的,不能细化到每个学生对知识点的掌握情况;学生也不能通过测试结果详细地了解自身知识和能力的欠缺,从而进行针对性学习。
目前市场上通行的在线阅卷系统多采用线下考试和线上阅卷的方式。传统的线下考试结束后,工作人员利用电子扫描仪器将答题卡录入电脑进行题目分类。系统对客观题进行自动评分,将主观题分配给老师进行流水线式的在线批阅。小组阅卷、取平均分等方式可以保证主观题得分的客观公正。阅卷完毕后,系统自动统计学生成绩,并给出班级或学校的整体分析结果和学生个人的诊断报告。阅卷系统的使用以地区或学校为单位,如果在多个地区使用,还能为用户提供基于更大范围的数据分析报告,从而使教师、学生了解学校、班级、个人在更大范围中的排名情况,得到更为准确的测评结果。这种方式不仅符合目前学校和考试的现实需要,还能有效减轻教师批阅纸质试卷的负担,有助于提高阅卷的科学性和公平性,也规避了在线答题的困难。目前,在线阅卷不仅广泛应用于中、高考中,也被不少学校用在期中、期末测试以及段考、月考中。
阅卷系统与题库系统的融合一方面有助于弥补题库系统的不足,另一方面也有助题库系统本身的建设和优化提升。阅卷系统是建设B类题库最便捷的方式。2006年教育部考试中心拟订了《建设教育考试国家题库的实施意见》,首次提出“A类题库”和“B类题库”的概念。A类题库以单个试题为基本构成单位,用户根据需要对题目重新排列组合再加以使用,B类题库以试卷为基本构成单位。与A类题库相比,B类题库具有成本少、投入低、建设周期短、发挥功效快等特点。B类题库的建设能为A类题库建设奠定坚实的基础[2]。阅卷系统与智能题库的嫁接,在为学校和教师提供极其实用功能的同时,无疑是建设B类题库的最好方式。
阅卷系统能起到优化题库的作用。众所周知,题库资源建设中难度等标签设置的准确性往往需要测评来检验,而专门的测评会花费大量的精力、时间和金钱。阅卷系统中的试卷和试题都被较大范围地使用和批阅过,这保证它们在入库打标签时具有相对准确的参考值,这也为题库下一步进行个性化资源推送奠定了良好基础,从而更大程度地发挥题库的功能。
阅卷系统将现实中的师生关系真正搬到了网络上。教师通过试卷批阅和系统分析,对自身教学情况和学生知识掌握程度有了更深入的了解,这有助于教师在真实课堂中对教学进行调整。阅卷系统与题库结合后,教师和学生能够利用题库中的资源,进一步进行个性化学习和开展针对性教学。教育职能部门或学校可通过将教师在线教学活动纳入考核的办法,在一定程度上解决针对性教学中所涉及的选题组卷、资源推送和批阅等实际问题,推动针对性教学活动的开展,有效弥补传统教育方式的不足。
[1] [捷]夸美纽斯.大教学论·教学法解析[M]. 北京:人民教育出版社,2006.
[2] 高升.对B类题库建设中若干问题的思考[J]. 中国考试(研究版),2008(2).