基于申威CPU的大型语言模型推理研究与应用

打印
收藏

收藏成功

微博 QQ空间微信

打开文本图片集

摘要：目前，ChatGPT、LLaMA、Gemini等大型语言模型已取得了显著突破，对自然语言处理领域产生了深远影响。然而，这些模型通常拥有数百亿甚至数千亿个参数，在部署时对计算资源和存储需求极高，导致其在计算资源有限的平台上难以应用。为此，介绍了当前主流的模型压缩方法，并结合llama.cpp项目，提出了一种在申威平台上利用纯CPU进行大型语言模型部署的方案。（剩余9250字）

试读结束

购买全文5.00元下一篇基于SLAM的自主导航探测艇系统

物联网技术

2025年08期

¥12.00/本

关于龙源 关于我们联系我们龙源大事记诚聘英才用户守则 购刊指南 电子刊购买流程会员介绍常见问题 客服中心 联系客服开具发票 商务合作 商务合作 网络信息举报
违法和不良信息举报电话：400-106-1235

举报邮箱：longyuandom@163.com
网上有害信息举报专区 支付方式 支付宝在线支付公司转账邮局汇款 特色服务 刊社入口友情链接

关注微信公众号
获取更多资讯
北京龙源网通电子商务有限公司
（署）网出证（京）字第188号丨京公网安备 11011302003690号丨京ICP备18053758号-2