清华大学张檬博士访问我组,并带来了题为“基于非平行语料的双语词汇表示学习”的汇报。
张檬博士现为华为诺亚方舟实验室语音语义组成员,于清华大学计算机系取得博士学位。研究兴趣是自然语言处理与机器学习技术在跨语言场景下的应用。在AAAI、ACL、EMNLP等人工智能与自然语言处理顶级会议和期刊上发表论文6篇。
双语词汇表示学习是跨语言自然语言处理中的基础任务,尽管平行语料是此任务的理想语料,但由于平行语料是稀缺资源,利用非平行语料学习双语词汇表示具有更广的应用前景。
本次的汇报主要介绍了相关工作中存在的挑战,并针对各个挑战依次介绍相应的研究工作,主要涉及监督学习、弱监督学习和无监督学习。