主持人语 大语言模型与语言研究的双向赋能与融合发展
大语言模型(以下简称“大模型”a)是当前生成式人工智能最主流的技术,具有强大的生成、迁移与交互能力。简单地说,该技术通过训练模型阅读海量文本,使其在语言表达、即时对话、任务规划、逻辑推衍等许多方面具备了与人类媲美的能力。目前,学界业界主要围绕3 个方面开展大模型的研究:(1)倾尽所有算力,通过提高数据质量、优化模型架构和训练策略等各种手段来研发基础、通用大模型,提升模型能力;(2)深入探索大模型的机理,拓展其性能,将最初仅能处理文本的模型,推向兼具文本、语音、图片、视频处理能力的多模态大模型;(3)开发专用或领域大模型、多智能体框架,以满足特定目标,拓展其应用场景。(剩余2241字)