(2023年更新)
我从2005年1月开始在中科院自动化所模式识别国家重点实验室任研究员,当年夏天开始招收、指导研究生。转眼18年过去,研究组已毕业了44名博士生、22名硕士生。为了使今后的研究生更好地了解本研究组的工作目标,在学习和研究中与研究组共同成长,我把我对研究生的一些要求和建议总结如下。
凡是有志来本研究组读研的同学,请仔细阅读本文。在认可和接受研究组的科研理念与要求的基础上,再跟我们联系。
“模式分析与学习”(Pattern Analysis and Learning, PAL)研究组成立于2005年,依托模式识别国家重点实验室(2023年重组为多模态人工智能系统全国重点实验室)。主要研究方向包括:(1)模式识别理论与方法;(2)文档智能分析与理解。模式识别理论与方法包括模式分类、特征提取、机器学习、结构模式识别、神经网络与深度学习、多模态学习与推理等,是解决不同场景多模态模式识别问题的基本方法。文档智能分析与理解研究内容包括文档图像处理、联机手写文档分析、版面分析、文本检测与识别、公式识别、图形符号识别、文档信息抽取、文档问答、解题等,背后依赖多模态学习和推理方法的创新。近年来,随着人工智能领域深度学习、多模态融合、大模型等技术演化,本研究组在不同方向、不同课题研究中的方案路线也越来越趋于融合统一。
最近几年,研究组承担的项目包括科技部重点研发项目和科技创新2030“人工智能重大项目”、国家自然科学基金创新群体、重点和面上项目、中科院战略先导科技专项课题、国际合作项目、企业合作项目等。过去五年,研究组发表国内外期刊和会议论文120多篇。文档图像分析和识别算法多次在国际学术竞赛中获得优胜,在一些商业系统中成功应用,并孵化成立了中科阅深科技有限公司。这些成果都是以研究生为主取得的。毕业的博士生有获得中科院院长特别奖和优秀奖、中国计算机学会优博论文,入选华为天才少年等。
研究组现有研究员3名、副研究员4名、助理研究员1名。每年招收博士生3~4名(包括直博生和硕士转博生),硕士生3~5名(包括全日制和非全日制研究生)。申请加入本组的研究生除了参加研究所统一组织的笔试和面试,还要参加本组的面试。录取后,研究组统一协调每个学生的研究方向和课题,并指派一名老师重点指导。研究课题瞄准前沿科学技术问题或应用需求,并与研究组承担的项目任务相关。
科研的目标是解决科学技术问题,产生理论或应用价值。理论成果包括自然规律的新发现、提出新的理论和方法、对已有发现和方法的理论解释等,对相关研究具有参考和启发作用。应用价值体现为新方法、新技术能提升应用系统的性能或克服应用中的缺陷。理论成果要有原创性并有参考价值,应用成果要能够转化为实用,这就是所谓“顶天立地”。
正是面向“顶天立地的”科研目标,本研究组的研究工作分为基础研究和应用基础研究两大方向。基础研究最终也是面向应用的,问题是从应用中提炼出来,结果也要通过应用场景数据来验证其价值。比如,模式分类和机器学习的理论方法旨在提高模式识别的分类精度、自适应性、鲁棒性、可解释性,降低系统复杂性,减少对训练样本的依赖等。因此,我们要解决的科研问题是直接或间接面向应用的。我想特别强调的是,瞄准实际应用,可以不断发现研究问题或拓展问题边界与深度,比如文档图像质量、版面结构、图文内容非常多样化,目前文档分析、识别与理解仍有很多问题没有解决。
发表论文是体现团队或个人研究水平的一个重要方面,但不是科研的目的,更不是科研的全部。不管是基础研究还是应用基础研究,如果成果有理论价值或应用价值,发表高水平论文是顺其自然的结果。反之,片面追求论文,而不解决科学技术问题,也难以发表高水平论文。
我们的科研理念是“面向问题,精益求精,力争领先”,“面向问题”是目标:解决科学技术问题,产生价值。“精益求精”是过程,不管是看文献、思考、设计方案,还是实验评价和总结,都要深入全面、精益求精。“力争领先”是结果,基础研究和应用基础研究都要在同领域领先或至少处于前沿,理论方法被人参考引用,应用技术产生领先的性能并能实用。
经常有保研或考研学生来信问我对研究生的素质和基础有什么要求。这个问题没有标准答案,每个人的情况不一样。但对于科研来说,固然专业知识和动手能力等基础很重要,对科研的认识和态度更重要。基础好的学生很多,但只有真正喜欢科研、自觉钻研的学生才能走得比较远。对科研兴趣的理解是个逐步的过程。只有经历了从付出到收获的科研全过程才能真正理解科研的意义,才知道是否真正喜欢。因此,研究生选导师、选课题不要从喜好出发,不要患得患失。这方面想得多的人多半做不好科研。
研究生在导师指导下开展高水平研究工作,解决科学技术问题,完成学位论文,取得学位。在开展研究工作的同时,积累了知识和技能,学会了做人做事的态度和方法,为未来职业发展打下基础。读研不能单纯以取得学位为目标,否则读研期间在学习和科研工作中就不可能全力投入,获得的知识、技能和成果有限,结果可能连学位也拿不到。
科研要花很多时间学习专业知识、调研前沿进展、思考研究方案、分析实验结果、反复优化改进,一定要付出比常人更多的努力才能取得成功。从我自己从事研究的经历和指导学生的经验,研究生一周至少要花60小时在学习和工作上,只有真正喜欢科研的人才会乐于接受这种寂寞单调的生活,并设定长远目标。但同时,科研中每取得一点进展、解决一个小问题、产生一点感悟也是极大的乐趣。
科研的过程有几个主要步骤:寻找问题—制定计划—思考方法—动手验证—分析总结。“方法思考-验证-分析”过程可能需要多次反复。寻找问题和设定目标非常重要,目标的高低决定了研究成果水平的上限。低水平目标不可能产出高水平成果,比如跟踪性研究不可能产出原创性、引领性成果。低水平目标甚至会使科研陷入被动,因为看得不远,等你取得一点进展时,别人已经走到前面去了。
研究生的科研过程是独立为主,导师为辅,即所谓“师傅引进门,修行在个人”。导师的主要职责是提供科研条件和寻找科研方向、申请科研项目(做到这些已经很不容易),只在学生入门过程中指导得细一点,入门后主要对研究方法进行宏观指导,对研究进展和成果价值进行评估反馈。因此,研究生要有独立做研究、独立解决问题的准备,研究过程中主动汇报、提问,同时积极与周边同学讨论交流。
为达到以上目标,我们期望研究生具备以下素质:
(1) 喜欢科研,志存高远。理解科研的意义,以解决科学技术问题为目标、以追求完美为标准,这样才能做到勤奋刻苦、甘于付出、坚忍不拔。对科研要时刻保持好奇心、对知识的渴求、对现状的质疑。
(2) 学风严谨,讲究诚信。科学技术研究是严谨的,容不得半点造假。伪造或修改实验数据、抄袭论文、窃取思想等学术不端行为迟早会被人发现,将会断送一个人的学术生涯并严重影响团队的学术声誉。
(3) 基础扎实,勤于动手。扎实的数学、英语和计算机编程基础是人工智能领域开展研究的基本要求。研究生要深入学习核心专业课,大量阅读文献,勤于思考,边想边做,通过实验验证和分析反馈不断深化。
(4) 脚踏实地,锲而不舍。科研要解决的问题一定是难题,否则早就被人解决了。科研中经常会有失败和挫折,只有脚踏实地、锲而不舍才能成功。问题的解决没有时间保证,因此研究生(尤其是博士生)要有延期毕业的思想准备。
(5) 团结协作,任劳任怨。解决复杂的科学技术问题需要团队分工协作。协作中要有沟通,也要有善于妥协、甘于牺牲的精神。不要怕吃亏,天下没有免费的午餐,没有白得的便宜,也没有白吃的亏。
(6) 充满自信,精力充沛。时间精力和勇气是年轻人最大的资本。做研究要有敢于挑战的勇气、敢想敢做的行动力、必定成功的信心。同时注意方法和节奏,规律作息,锻炼身体,保持精力充沛。
研究生通过学习和科研,直接的收获是知识、技能和成果。知识包括基础知识和专业知识、领域前沿动态和趋势;技能包括动手实践能力、科研方法和思路、分析问题解决问题的能力、写作能力和交流能力;成果包括解决问题的理论方法、技术、系统、论文、专利等。这些将为你的求职和事业发展奠定重要的基础。
做科研的过程同时也是学习做人、处事的过程。为人处事的方式方法也是重要的收获,是将来事业发展必不可少的职业素质。这些包括:待人接物的方式、与人分工协作的方式、总结表达、沟通能力等。
人在社会上生存发展都需要人脉。研究生期间认识的老师、同学、同事都将成为你重要的人脉资源。要动用人脉资源,必须先付出,做事负责任:主动、认真、任劳任怨、把集体和他人的事当自己的事。做一个靠谱的人,在需要帮助时才会得到别人的诚意支持。
所有这些收获都是你的努力付出换回来的,付出越多必定收获越多,定位高远才会行以致远。
刘成林
2023年7月
24th International Conference on Pattern Recognition
15th International Conference on Frontiers in Handwriting Recognition
10th IAPR-TC15 Workshop on Graph-based Representations in Pattern Recognition
Haidian | Beijing | China
Phone : (+86-10)8254-4797
Fax : (+86-10) 8254-4594
Email:liucl@nlpr.ia.ac.cn
Website:www.nlpr.ia.ac.cn/pal/