李晓辉同学在ICDAR-2017-POD竞赛中取得优异成绩

POD (Page Object Detection, ICDAR, 2017) 是对PDF文档图像中目标进行检测的竞赛。 该竞赛主要有4个任务:Task A (Formula Detection) 、Task B (Table Detection)、Task C (Figure Detection) 和Task D (Page Objection Detection)。

TaskA的任务是检测文档图像中的公式, 该任务的主要难点在于生成公式候选区域的生成及分类以及如何确定相邻公式之间的界限, Task B的任务是检测文档图像中所有表格, 该任务的主要难点在于三线表格以及无框线表格的候选区域如何生成、分类及合并, Task C的任务是检测文档图像中的插图, 该任务的主要挑战在于样本稀疏、类内差异大、相邻目标之间的界限难以确定等, 这三个任务的评价准则为在IOU (Intersection Over Union)=0.8和IOU=0.6条件下的Precision、Recall、F1-Score以及在11点召回率下的AP(平均正确率)。 Task D 是Task A、Task B和Task C的综合,全面考虑系统对公式、表格和插图的检测性能, 该任务的评价标准为在IOU=0.8和IOU=0.6的条件下,三个子任务的Ave-F1(F1-Score的平均值)以及mAPs(AP的平均值)。

POD竞赛采用的数据集为该竞赛的官方数据集, 包括1600张训练图像以及817张测试图像。 训练集给出每个目标的位置以及该目标的类别,其中目标位置由该目标的外接框的四个坐标表示。 在本次竞赛中,共有11个队参赛,最终有7个队伍完成了比赛并提交了结果。 最终,在IOU=0.8的条件下,在我们组在该竞赛的四个任务的F1值(或Ave F1)值以及AP值(或mAPs值)标价标准下都获得了第一名的成绩。 在IOU=0.6的条件下,我们在四个任务的F1值(或Ave F1值)的评价指标下都获得第一名的成绩, 在AP值(或mAPs值)的评价指标下都获得了第二名的成绩。

相关链接:http://www.icst.pku.edu.cn/cpdp/ICDAR2017_PODCompetition/index.html

exit
Contact Information

Haidian | Beijing | China

Phone : (+86-10)8254-4797

Fax : (+86-10) 8254-4594

Email:liucl@nlpr.ia.ac.cn

Website:www.nlpr.ia.ac.cn/pal/