中国大模型密集开源的原因及可能影响

  • 打印
  • 收藏
收藏成功

自2023 年以来,阿里巴巴陆续开源通义千问(Qwen)系列大语言模型,其在自然语言理解、多模态交互等领域具有突破性表现,在多项基准测试中可与全球顶尖大模型并驾齐驱。中国人工智能企业深度求索(DeepSeek)在2024 年底和2025 年初,相继推出DeepSeek-V3 与DeepSeek-R1 两大开源引擎,前者以媲美GPT-4 的千亿参数架构构筑智能基座,后者则在复杂逻辑推理的深水区开辟新航道,将人机协作的边界推向更辽阔的疆域。(剩余6878字)

monitor