面向LLM本地化部署的并发性能协同评估研究

  • 打印
  • 收藏
收藏成功


打开文本图片集

中图分类号:TP311.5 文献标识码:B 文章编号:1006-8228(2026)03-90-06

0引言

近年来大语言模型(LLM)的飞速发展正改变着各个领域的应用范式-2,本地化部署方式已成为重要的技术趋势[3-4]。用户需要在自身可提供的本地计算资源范围内做出权衡,因此工程决策成为重点难点

如何在本地计算资源固定的前提下,使本地部署LLM的性能与成本达到最优平衡。(剩余8820字)

monitor
客服机器人