计算所
中国科学院
内部系统
English
计算所
中国科学院
内部系统
English
首页
研究组介绍
新闻快讯
学术动态
研究队伍
教师
学生
曾任职员工
已毕业学生
曾访问学者
论文论著
发表论文
毕业论文
授权专利
出版专著
软件著作权
研究项目
在研项目
完成项目
研究专题
多语言机器翻译
非自回归机器翻译
同声传译
人才招聘
资源共享
百聆大模型
demo
paper
blog
code
历史版本
新闻快讯
您当前的位置:
首页
>
新闻快讯
22
2013-11
机器翻译,让梦想照进现实——橙译中科成立2周年记
2011年11月,橙译中科在北京中关村正式成立。这家公司从国内最具影响力的机器翻译研究团队之一——中科院计算所自然语言处理研究组走出来,从一开始,就专注于机器翻译技术的研发。公司团队的核心使命就是推动最新的机器翻译研究成果从实验室走出去,真正服务于社会大众。
最近20年,以统计机器翻译为代表的机器翻译技术突飞猛进,大数据的涌现,以及电脑计算和存储性能的迅速提升,为这项技术迈向实用奠定了基础。而互联网的普及,则使得跨越语言障碍的沟通需求变得更为普遍和迫切,这为机器翻译技术的应用打开了一扇大门。作为长期从事机器翻译研究的团队,我们已经在学术研究上取得了广为人知的成就,但我们的梦想不是让自己的研究成果停留在论文上,而是能满足社会的现实需求,真正创造价值。
虽然潜在的需求巨大,但我们追求梦想的道路并不平坦。这一方面是因为新的机器翻译技术刚刚从实验室走出来,在翻译质量、速度、稳定性等方面还需要仔细打磨;另一方面是因为机器翻译的产品模式和商业模式都还远未成熟,需要不断尝试和探索。在领域之外的人眼里,我们是机器翻译技术的专家,但对于市场,我们只是小学生。这2年时间有探索,有彷徨,有失败的苦涩,也有成功的喜悦。“路漫漫其修远兮,吾将上下而求索”,对于走在创业路上的我们而言,这句话每次读来都有一种别样的感受。
我们坚信,只有选择技术立足的路线,才能最大程度为社会贡献价值,也才能让我们走得更长远。虽然在当前的环境下,这种路线注定艰辛坎坷,但幸运的是,我们坚持下来了。现在我们的系统作为“讯飞语点”和“移动灵犀”的翻译后台,已经开始为成千上万的用户提供服务。我们的企业整体解决方案已经开始被多家著名公司采纳或使用。而我们在专利、电商、口语等领域已经远远超越了目前几个主流的在线翻译系统,并向第三方开发者提供在线接口。我们依靠自己的力量,搭建了一整套面向大数据处理的机器翻译计算平台,开发了稳定、快速、高质量的核心引擎。现在,我们拥有清晰的目标,团结的团队,坚实的积累,这些都为未来的发展奠定了良好的基础。我们相信,梦想必将点亮橙译的现实。
虽然现在还远谈不上成功,但橙译走到今天,也殊为不易。一路走来,我们要感谢的人太多太多。首先要感谢我们的用户,是你们让我们相信自己的技术很有价值,你们的反馈不断鞭策我们改进技术;其次要感谢橙译团队的每个成员和你们的家人,是大家的努力工作和默默支持让橙译拥有了不错的开局和光明的未来;最后要感谢一路上帮助过我们的每一位朋友,是你们给了我们坚持的信心和勇气。
谨以此文纪念我们奋斗的两年,并祝橙译生日快乐!
15
2013-11
新老同学相聚CWMT2013
2013年10月31日至11月1日,第九届全国机器翻译研讨会(CWMT2013)在昆明如期召开。该研讨会自2005年第一届召开以来,共组织了五次全国性的机器翻译评测(2007、2008、2009、2011、2013,本研究组承担了这五次评测的组织工作)、一次开源系统模块开发(2006)和一次战略研讨(2010),这些活动对推动我国机器翻译技术的研究和发展产生了积极而深远的影响。
今年的研讨会在组织方—昆明理工大学的精心安排下,于风景秀丽的滇池温泉花园国际大酒店成功召开,两天的会议日程很紧,期间,与会者不仅聆听到了国内机器翻译技术的最新研究动态和发展历史,与同行交流了机器翻译研究和开发的心得体会,还在会后欣赏了如诗如画的春城美景,对本组参会的同学来说,更能与暂时不在组里的老师和已经毕业的学长们齐聚一堂、共叙友情,实乃一大快事!
下面是大家庭的一些合影(拍摄:卢亚军老师),与大家分享:
13
2013-11
西雅图EMNLP2013参会实录
2013年10月19日至21日,我们课题组的孟凡东博士、于恒博士(在纽约城市大学实习)和已毕业的夏天同学参加了今年在美国西雅图(Seattle)举办的自然语言处理的经验方法会议(EMNLP)。EMNLP隶属计算语言学学会(The Association for Computational Linguistics) 旗下,是国际上最具影响的计算语言学及自然语言处理学术会议之一。除EMNLP主会议外,还有3个专题研讨会(Workshop) 和2个特邀报告(Invited Talk)同期举行。
今年我们课题组被EMNLP会议录用了三篇论文,分别是:孟凡东的“Translation with Source Constituency and Dependency Trees”、于恒的“Max-Violation Perceptron and Forced Decoding for Scalable MT Training”和夏天的“Improving Alignment of System Combination by Using Multi- objective Optimization”。
10月19日会议正式开幕。上午的报告涉及信息抽取、语言获取和处理、自然处理在社会媒体上的应用以及语义分析等相关内容。午后,Andrew Ng教授给我们带来了第一篇特邀报告“The Online Revolution: Education for Everyone”。接着,机器翻译、形态分析等主题报告并列展开,这些报告让我们了解到机器翻译和形态分析方面一些最新的研究进展和研究方法,比如本研究组毕业的肖欣延博士关于同步文法的改进工作等,令我们耳目一新。
晚上6点到9点是Poster Session时间,由于poster session的互动方式较为灵活和直接,让参会者能更加充分地了解彼此的工作,所以会议的这个环节起到了较好的交流和沟通作用。下面是我们组的参会人员在这个环节的照片。
第二天的会议由Fernando Pereira博士的特邀报告“Mining in the Wild”拉开了序幕。机器学习在自然语言处理中的应用、自动摘要和自然语言生成、信息抽取和社会媒体、机器翻译和语义分析等相关报告再次展开。在机器翻译方面,熊德意博士基于篇章的最新工作,利用了较多的篇章知识来改进机器翻译的效果,让我们颇受启发。
10月21日,会议第三天,大家首先共同听取了信息抽取方向的报告。接下来,句法分析、语义分析、自然语言处理应用三个方向的相关报告并列展开。下午五点左右,本届EMNLP会议圆满结束。
EMNLP会议让我们再次见到且结识了一些在自然语言处理领域工作的研究者,并与他们进行了较为深入的交流。这个会议也让我们深切地感受到:一方面,现在国内的机器翻译技术发展很快,跟国外的差距在不断缩小。另一方面,我们要做的工作还很多,需要不断地发奋努力,争取在本领域内做出更多更有创意、更加精彩的工作来。
15
2013-08
研究组ACL会议纪行
2013年8月3日至9日,我们参加了在保加利亚首都索菲亚(Sofia)举行的第51届国际计算语言学年会(ACL)。ACL隶属计算语言学学会( The Association for Computational Linguistics) 旗下,是国际上最具影响的计算语言学及自然语言处理学术会议。除ACL主会议外,还有15 个专题研讨会(Workshop ) 和7个专题讲座( Tutorial)同期举行。
今年我们课题组有六篇论文被ACL录用,包括姜文斌的“Discriminative Learning with Natural Annotations: Word Segmentation as a Case Study”,刘凯的“Bilingually-Guided Monolingual Dependency Grammar Induction”,刘群老师的“A Novel Graph-based Compact Representation of Word Alignment”,贲国生的“Bilingual Lexical Cohesion Trigger Model for Document-Level Machine Translation”,李响的“Iterative Transformation of Annotation Guidelines for Constituency Parsing”和王志洋的“Stem Translation with Affix-Based Rule Selection for Agglutinative Languages ”。对应地,本次我们课题组吕雅娟老师、姜文斌老师、王志洋博士以及刘凯博士出席参加今年在保加利亚举办的ACL会议。
课题组一行本次与会的大体行程如下:8月3日出发前往保加利亚首都索菲亚;8月4日于索菲亚调整时差、注册会议、熟悉会场并准备会议报告;8月5日至8月7日参加ACL会议;8月8日前往黑海游览;8月9日启程回国,8月10日抵达北京。
具体与会行程:
我们于北京时间8月3日乘坐航班前往保加利亚首都索菲亚。中途于奥地利维也纳机场转机,并于当地时间8月3日晚12点左右抵达索菲亚机场。
8月4日当天上午我们于宾馆休息调整时差。下午我们熟悉了会场路线,于主会场进行了会议注册并为第二天报告做好了充分的准备。
8月5日会议正式开幕。我们早上8点半从宾馆出发,步行至会场准时参加了上午的大会开幕式。之后Harald Baayen教授为我们带来了令人印象深刻的特邀报告“When Parsing Makes Things Worse: An Eye-tracking Study of English Compounds”。茶歇过后,我们课题组一行人参加机器翻译分会场的报告和讨论。机器翻译分会场的第一个报告是我们组的姜文斌老师代刘洋老师做的“A Shift-Reduce Parsing Algorithm for Phrase-based String-to-Dependency Translation”报告。作为分会场的第一个报告,姜老师利用其独特的幽默方式在报告期间缓解了大会原本十分严肃的气氛,因此该会场之后的报告得以在相对轻松愉快的氛围下进行。午饭过后,刘凯和王志洋博士利用空闲时间将个别poster进行完善并就近打印,保证当晚poster session的顺利进行。下午的机器翻译分会报告结束后,我们将所有的6份poster张贴在会场相应位置。在poster session期间包括刘群老师在内所有人员均在相应时间对相应的poster进行讲解,并利用非讲解时间了解会场内其他人的研究工作。由于poster session的互动方式较为灵活直接,我们纷纷表示该会议形式使我们能够更加主动充分了解他人的工作,而不是像大会报告那样被动的接受。
8月6日早上主会场同样安排了激动人心的特邀报告,由Facebook研究员Lars Rasmussen带来的“The Natural Language Interface of Graph Search”。对应的,之后全天我们均在机器翻译分会场听取同行的研究报告。从最新的机器翻译研究进展可以看出,机器翻译的研究依然在稳步前行,仍然能够看到不少激动人心的研究进展。
8月7日早上依然安排了一个特邀报告“Individual Differences in Language and Executive Processes: How the Brain Keeps Track of Variables”,由于该研究涉及到了我们领域较少涉及的神经学领域所以对于我们来说难度挺大,但是我们都认为该研究为我们之后的相关研究提供了新的方向。下午举行了大会闭幕式,并宣布了下届(巴尔的摩湾)及后届(北京)会议的举办地。
8月8日当天我们参加了中国参会研究人员自发组织的“黑海一日游”。当地时间凌晨4点出发,于下午抵达黑海城市“瓦尔纳”。下午我们沿着黑海岸游览,领略了黑海风光。下午5点踏上返程的汽车,并于第二天1点左右回到宾馆休息。
8月9日当天中午退房,在登机前的空隙时间沿着游览路线步行游览了索菲亚城市风光。之后赶往索菲亚机场登机起飞,并于北京时间8月10日中午11点左右返回北京。至此,我们课题组的ACL会议索菲亚之行圆满结束。
会议过程中,我们再次见到或者结识了很多在自然语言处理领域工作的研究者,并与他们进行了一些交流。如Pascale Fung教授,苏克毅教授,David Chiang副教授等人。同时还认识了在美国、欧洲、日本等地的研究自然语言处理的中国人,大家在一起聚餐,感觉很亲切。我们深切感受到,现在中国发展很快,跟国外的差距越来越小了。今年的程序委员会主席Pascale Fung(香港)在茶歇讨论的时候特别提到:今年ACL会议国内学术界,知名的中国人越来越多,论文的质量和产量都比以往有显著的进步。国内的研究者和海外的华人学者,为推动NLP的发展做出了卓越的贡献,这些都为祖国赢得了荣誉。时下虽然是本领域的平台期,但各国的研究者仍在孜孜不倦地努力。这是对我们的挑战,也是让我们赶超西方的契机。迎难而上,奋发图强,是每一个华人学者的重任。
03
2013-06
宝剑锋从磨砺出 — 本组2013年度博士生毕业论文答辩工作圆满完成
2013年5月28日,星期二,上午的天空下着蒙蒙细雨,本组2013博士生毕业论文答辩会在计算所501会议室如期召开,参加此次答辩的总共有三名同学:王志洋、熊皓、涂兆鹏。
以下选取了答辩过程中一些精彩的片段与大家分享:
“宝剑锋从磨砺出,梅花香自苦寒来”,热烈祝贺这三位通过博士毕业论文答辩的同学!真心祝愿他们毕业以后能大展鹏程、搏击长空!
首页
上一页
16
17
18
19
20
下一页
尾页
查看更多