在数学建模竞赛、语文作文考试等一类没有标准答案的答卷评阅中,不同评阅人对一份答卷给出分数,出现一定范围内的差别是正常的。但是,由于众多客观、主观因素的影响,某些评阅人的打分会存在异常现象:
l 打分普遍偏高或偏低,导致他评阅的所有答卷的平均分明显高于或低于总体平均分(总体指全体评阅人对所有答卷的打分);
l 打分范围过窄,区分度太小,导致他评阅的所有答卷的分数范围明显小于总体的分数范围。
在评阅过程中组织者可以通过一定的程序,让每位评阅人随机地评阅若干份试卷,并且同一份答卷也随机地由若干位评阅人评阅。而在评阅结束后,组织者要根据所有评阅结果筛选出打分存在上述异常现象的评阅人,并且确定一份答卷的最终分数。需要
1) 给出筛选打分存在上述异常现象的评阅人的数学模型和求解方法。
2) 给出确定每份答卷最终分数的数学模型和求解方法。
模拟产生数据进行计算并检验模型:将150份答卷随机分配给9位评阅人,每份答卷由3人评阅(每位评阅人评阅50份),评阅人中一人打分偏高,一人打分偏低,一人打分范围过窄。首先模拟产生一组数据作为答卷的真实分数,再把真实分数上增加扰动,作为评阅人的打分。然后将模型用于这组数据,应能把三维出现异常的评阅人筛选出来,并且是确定的每份答卷最终分数和真实分数相近。
l 打分普遍偏高或偏低,导致他评阅的所有答卷的平均分明显高于或低于总体平均分(总体指全体评阅人对所有答卷的打分);
l 打分范围过窄,区分度太小,导致他评阅的所有答卷的分数范围明显小于总体的分数范围。
在评阅过程中组织者可以通过一定的程序,让每位评阅人随机地评阅若干份试卷,并且同一份答卷也随机地由若干位评阅人评阅。而在评阅结束后,组织者要根据所有评阅结果筛选出打分存在上述异常现象的评阅人,并且确定一份答卷的最终分数。需要
1) 给出筛选打分存在上述异常现象的评阅人的数学模型和求解方法。
2) 给出确定每份答卷最终分数的数学模型和求解方法。
模拟产生数据进行计算并检验模型:将150份答卷随机分配给9位评阅人,每份答卷由3人评阅(每位评阅人评阅50份),评阅人中一人打分偏高,一人打分偏低,一人打分范围过窄。首先模拟产生一组数据作为答卷的真实分数,再把真实分数上增加扰动,作为评阅人的打分。然后将模型用于这组数据,应能把三维出现异常的评阅人筛选出来,并且是确定的每份答卷最终分数和真实分数相近。