PAL组在 ICDAR 2025 中文高考试卷理解竞赛中取得第二名的好成绩。该竞赛由中图科信和北京大学王选计算机研究所共同承办,面向中国高考试卷理解任务,数据覆盖高中全部学科,重点考察多模态大模型对复杂中文文档的解析、问答与推理能力。
针对该任务,PAL组提出了一套面向复杂中文试卷理解的解决方案,主要包括三个关键环节:一是通过训练分类器进行关键页选择,提升有效信息定位能力;二是针对特定问题引入 OCR 工具调用,增强模型对复杂文本内容的识别能力;三是采用 Self-improve 自我改进机制,针对推理类问题生成长链回答,并筛选正确结果进行再训练,持续优化模型表现,最终达到 82.1%的准确率。
24th International Conference on Pattern Recognition
15th International Conference on Frontiers in Handwriting Recognition
10th IAPR-TC15 Workshop on Graph-based Representations in Pattern Recognition
Haidian | Beijing | China
Phone : (+86-10)8254-4797
Fax : (+86-10) 8254-4594
Email:liucl@nlpr.ia.ac.cn
Website:www.nlpr.ia.ac.cn/pal/