智能口语双机评测模式在外语听说机考评卷中的可行性研究

打开文本图片集
[摘要]基于现有英语听说考试人机互评的评卷模式,探索双机评测模式可行性,使用上海市初中外语听说测试全真模拟数据试验,对比3种独立计算机智能评分算法的效果。结果显示,机评分与报道分一致性达到96%以上,具备良好的效果,但存在1659份样本双机评后仍误判的效果风险,综合考虑双机评测模式的评卷组织、机评评价机制仍不完备,暂不具备可行性,需要进一步的算法提升和应用方法研究;算力改变对比验证结果表明,评分准确性几乎不下降的情况下,采用GPU算力结构的评分算法的运算速度相当于CPU算力结构的6倍,这可以使得评分时间和硬件投入大幅度减少。(剩余16564字)