我们一定能保证你俩得的分数是一样的。
就是我们所追求的「公平性」原则在岗前培训中的体现。
2、三重保护:阅卷流程中的公平性维护
除了在岗前培训阶段的制度设计,我们在真实阅卷过程中也有很多环节可以随时监控老师对评分细则的把控。
在考高阅卷系统中,每一个监考老师登陆之后屏幕上都有60秒的停顿,屏幕上只有一行红色的字:
「现在已经进入正式评卷阶段,你的打分将直接影响考生的最终成绩,请严格执行评分细则!」
60秒你什么都不能干,只能盯着它看。
每一个阅卷老师都明白,自己面对的不是流水线上的工业产品,每一份试卷背后都是一个十年苦读的具体的学生。
参与高考阅卷的每一位老师自己也都经历过高考,还有很多是多年毕业班的执教老师——知道了这些,你就明白网络上那些「随便改个分」的说法在老师的主观意愿上都是很难成立的。
而且在客观条件上,老师的判分也会非常谨慎,比如阅卷系统的制度设计:
…
首先一个系统设置,就是我们的电子化阅卷系统会「随机重复」地给阅卷老师发放一些你自己之前改过的试卷。
但是通常而言,如果老师每小时批阅几百上千份试卷,我们是不可能记住哪一张是自己改过的,但是系统会时不时悄悄的塞给我们一份自己之前改过的试卷,系统的目的就是想要看一下,你同一个人两次看一张一模一样的试卷,你判的分数是不是丝毫不差的。
这个分数是不能有任何误差的,如果你的两次判分出现误差,系统马上对你做一次记录——同一个人改同一张卷子,两次的分数居然都不一样,那说明你肯定是对评分细则理解有问题的,如果你总是出现这个问题,那阅卷组长就会把你叫出去单独谈话,看看你到底是怎么回事儿。
第二个系统设置叫做「双人确认」。
这可能是流传最广的一个设计,很多同学都听过这个说法:就是你的每一份试卷系统都至少会分发给两位老师的打分,100万份试卷我们至少要批阅200万次,尽管这样让我们整体的工作量直接翻倍,但这是必要的工作。
对于每一道题目,系统都会设置一个容错率——这个分数通常是1到2分,往往跟这道题目的总分值相关——比如高考数学全国卷的大题都是12分,那么它的容错率一般是2分。
当两位老师批阅同一道题目后,系统会比较这两个老师评分的差值,如果这个差值不超过容错率,那么一个学生的最终得分将会是这两位老师打分的均值:比如说一张试卷,我认为这位考生应该得8分,然后另外一个老师认为这一张试卷应该得9分,那么这是可以的,这个学生最终得分会是8。5分;
但是,如果两位老师对同一道题目的评分超过容错率,那么系统会引入第三位阅卷老师打分,并且对比这三位老师的差值,取相邻最小的那两位老师的分值平均:比如一张试卷,我认为只能得5分,另外一个同学老师认为这其实是一份8分的试卷,那这时系统就会引入第3个老师来进行评分,假如第三个老师认为这是一个6分的试卷,那么系统会在5,8,6这三个数据之间比对,很明显5和6差值更小,所以这个学生最终得分是5。5分。
这个时候,那个打8分的老师实际上判分作废了——这个在我们的行话里叫做「废卷」,废卷的意思是,你的评分和自己的同行之间出现了特别大的偏差,在刚刚的例子里,大多数人都认为这是一个5-6分的试卷,你怎么就认为它值8分呢?这肯定是你对评分细则的理解有问题,所以如果一个老师判出的废卷率太高的话,你仍然会被阅卷组长叫出去单独谈话。
当然有些时候你会问:如果三个老师打出来的分数是一个等差数列怎么办呢?比如刚刚的那个例子,如果第三个老师打出了11分——5,8,11这三个分数谁也不比谁更近,相当于三个老师对于同一个试卷的认知非常离散,怎么办呢?
首先你可以想象这样的情况在真实情境下是很难出现的,总共12分的题怎么会出现这么离散的差异化评分呢?
但如果真的出现这种情况,这张试卷就会被提交到阅卷组组长那里进行仲裁。
通常而言遇到这种情况阅卷组长会把评分的三位老师叫进来听一听每一位的决策过程,综合考虑给出一个最合适的分数。
最后,还有一种非常特殊的情况,就是我们会在阅卷过程当中碰到一些在最初版本的评分细则之外的解法,它是正确的解法,但在我们的评分细则之外——这种情况在解析几何还有导数的大题当中经常碰到。
遇到这种在评分细则上不存在的解法,我们阅卷组的老师是没有权限直接判分的——我们这时会点击阅卷系统中的「问题卷」,将这份试卷直接提交到阅卷组长那里。
如果这种特殊解法只是偶尔出现,比如一