财新传媒
财新传媒
1111111
财新通行证

DeepSeek十问十答

文|黄乐平 陈旭东
2025年02月06日 10:14
DeepSeek对算力需求、芯片市场、技术创新、端侧智能、出口管制、投资逻辑、软件生态、开源生态以及中国科技资产估值有哪些影响
news 原图 DeepSeek。图:视觉中国

  DeepSeek的横空出世引发了AI产业的深刻讨论。本文就DeepSeek对算力需求、芯片市场、技术创新、端侧智能、出口管制、投资逻辑、软件生态、开源生态以及中国科技资产估值等十个关键问题进行了深入分析。

  问题1:DeepSeek是否会抑制算力增长

  据DeepSeek V3技术报告,V3模型的训练总计只需要278.8万GPU小时,相当于在2048卡的H800GPU集群上训练约2个月,合计成本约557.6万美元,相较而言,Llama 3系列模型的计算预算则多达3930万 H100 GPU小时,DeepSeek训练成本约相当于Llama 3系列模型的7%。

责任编辑:张帆 | 版面编辑:王影

观点频道所发布文章及图片之版权属作者本人及/或相关权利人所有,未经作者及/或相关权利人单独授权,任何网站、平面媒体不得予以转载。财新网对相关媒体的网站信息内容转载授权并不包括上述文章及图片。文章均为作者个人观点,不代表财新网的立场和观点。

财新网所刊载内容之知识产权为财新传媒及/或相关权利人专属所有或持有。未经许可,禁止进行转载、摘编、复制及建立镜像等任何使用。

如有意愿转载,请发邮件至hello@caixin.com,获得书面确认及授权后,方可转载。

推荐阅读
财新移动
说说你的看法...
分享
取消
发送
注册
 分享成功

订阅财新网主编精选版电邮>>