DeepSeek如何做到低训练成本

  • 打印
  • 收藏
收藏成功

深度求索公司在网络上发布的大语言模型DeepSeek最新版本轰动全球。美国硅谷的高科技公司首席科学家、相关领域的顶级学者纷纷加入了讨论,甚至引发了纳斯达克指数的异常波动。

那么,在市场上已经存在不少大语言模型的情况下,为什么DeepSeek能引起如此大的轰动?原因有二:其一,它开放源代码,允许全世界下载,支持本地部署;其二,它的低训练成本打破了大语言模型完全依赖性能和显卡的思维定式。(剩余1178字)

目录
monitor