本研究组经过多年的技术积累,开发了一批用于自然语言处理的工具软件,愿意与国内外同行共享。以下是部分工具的可执行代码,欢迎下载

       时间和数字命名实体抽取工具(Time&Number Entities Extraction Tool)

        时间和数字命名实体抽取工具用于从中文或英文文档中抽取所出现的时间和数字命名实体,并对它们进行翻译。

 

        Urheen词法分析系统 (win32版本及linux版本)(A Chinese/English Lexical Analysis Toolkit)

        可用于汉语分词和词性标注(CTB标准),以及英语token和词性标注(WSJ标准)。

 

          Oboe中文句法分析系统Oboe: A Chinese Syntactic Parser)

        中文句法分析系统,可以对中文句子进行句法分析,并以图形的形式显示出短语结构树和依存结构树。

      


       其他开放源代码的工具放在模式识别国家重点实验室开源平台 OpenPR (
http://www.openpr.org.cn/),有兴趣的朋友请访问 OpenPR,点击“Download”下面的“NLP Toolkit”菜单。
      欢迎广大同行和朋友提出宝贵意见,谢谢。

 

如有问题请联系 zlu@nlpr.ia.ac.cn