中科院计算所自然语言处理研究组简介
中国科学院计算技术研究所自然语言处理研究组长期从事自然语言处理和机器翻译研究,在汉语词法分析、句法分析、机器翻译等方面都取得了突出的研究成果。在机器翻译方面,研究组专注于机器翻译研究10余年,曾经开发过基于规则、基于实例和基于统计的机器翻译系统,对机器翻译基础技术有深厚的积累。特别是近年来在基于句法的统计机器翻译方面,提出了基于源语言句法分析树和句法森林的一系列统计机器翻译模型,在自然语言处理最重要的国际刊物和学术会议上发表了一系列高水平的学术论文,相关研究论文在国际同行中被普遍引用。近年来,研究组在本领域最有影响的国际会议ACL上发表论文20余篇,论文发表的数量与质量在国内位于首位,在国际学术界也位居前列。我们在2006 ACL会议上发表的论文“Tree-to-String Alignment Template for Statistical Machine Translation”获得大会颁发的“亚洲自然语言处理优秀论文奖(Meritorious Asian NLP Paper Award)。这是国内研究者首次在该会议上获得论文奖。研究组在自然语言处理和机器翻译方面的研究成果已经申请发明专利16项(已经授权8项),获得计算机软件著作权登记15项。研究组开发的机器翻译系统在国际上竞争最为激烈、也是影响力最大的NIST机器翻译中多次取得好成绩。2009年在NIST机器翻译评测的汉英项目中获得综合成绩第3名,这也是国内研究单位迄今为止在该项评测中获得的最好成绩,研究组也成为首次在NIST机器翻译评测研讨会上做报告的国内研究机构。在2010年IWSLT国际口语机器翻译评测中,我们取得了汉英双向翻译8个项目中的6项第一名的优异成绩。自然语言处理研究组已经将统计机器翻译技术实际应用到了专利翻译、移动翻译、新闻翻译等领域中,取得了良好的应用效果,获得用户好评。研究组在机器翻译和汉语自然语言处理方面的研究成果获得北京市2009年科学技术进步二等奖。研究组已成为国际上机器翻译研究领域最有影响的研究团队之一。近几年来,中科院计算所自然语言处理研究组和新疆大学、内蒙古大学、青海师范大学以及多个国外研究机构建立了良好的合作关系,在维语、蒙语、藏语、韩语、泰国和汉语的机器翻译研究上做了大量的工作,目前已经收集了较大规模的多语言平行语料库和翻译词典资源,搭建了维语、蒙语、藏语、英语、韩语、阿拉伯语、越语、泰语等多种语言的在线翻译系统。其中,维汉翻译系统已经在一些国家重要部门单位投入试运行,得到了用户好评。

登录