2025年5月,自然语言处理组1篇论文被ACL 2025主会接收。 ACL的全称是The Association for Computational Linguistics,是国际计算语言学界影响力最大的学术组织。ACL年度会议也是计算语言学领域的最重要的国际会议,是CCF推荐的计算语言学方面唯一的A类会议。
被录用论文的简要介绍如下:
1. LLaMA-Omni 2: LLM-based Real-time Spoken Chatbot with Autoregressive Streaming Speech Synthesis (Qingkai Fang, Yan Zhou, Shoutao Guo, Shaolei Zhang, Yang Feng)
Accepted by ACL 2025 Main Conference
简介:实时、智能、自然的语音交互是下一代人机交互不可或缺的组成部分。近期的技术进展已经展现了基于大语言模型(LLMs)构建智能语音聊天机器人的巨大潜力。在此,我们推出LLaMA-Omni 2,这是一系列参数规模从0.5B到14B的语音语言模型(SpeechLMs),能够实现高质量的实时语音交互。LLaMA-Omni 2基于Qwen2.5系列模型构建,集成了语音编码器和自回归流式语音解码器。尽管LLaMA-Omni 2仅使用了20万条多轮语音对话样本进行训练,但在多个口语问答和语音指令遵循的基准测试中表现出色,其性能超越了以往顶尖的语音语言模型,例如在数百万小时语音数据上训练的GLM-4-Voice。