2024年12月,自然语言处理组1篇论文被AAAI 2025接收。AAAI 2025的全称是Thirty-Ninth AAAI Conference on Artificial Intelligence,由人工智能促进协会AAAI组织,每年举办一次,为人工智能领域的顶级会议之一。AAAI 2025将于2025年2月25日-3月4日在美国费城举行。
被录用论文的简要介绍如下:
- Large Language Models Are Read/Write Policy-Makers for Simultaneous Generation (Shoutao Guo, Shaolei Zhang, Zhengrui Ma, Yang Feng)
- AAAI Main Conference, long paper
简介:流式生成模型在读取输入的同时生成目标端回复,其往往需要一个策略决策者来确定合适的输出时机。现有的流式生成方法通常采用传统的编码器-解码器架构,并通过复杂的动态规划技术来同时学习生成回复和决策能力。尽管当前的大语言模型(LLMs)在文本生成方面表现出色,但它们在利用传统训练方法来充当决策者角色时却面临极大的挑战,这限制了它们在流式生成中的探索。为克服这些限制,我们提出了一种新型的LLMs驱动的流式生成框架(LSG),其允许现成的LLM决定生成时机并同时产生输出。具体来说,LSG选择最小化延迟的生成策略作为基准策略。参考基准策略,LSG使LLMs能够设计出更好的生成策略,在延迟和生成质量之间取得更好的平衡,并相应地生成结果。我们在流式文本到文本翻译、流式语音到文本翻译和流式自动语音识别任务上的实验表明,我们的方法可以利用开源LLM实现最先进的性能,并在现实世界场景中展示其实用性。