财新传媒
观点 > 聚焦 > 正文


DeepSeek十问十答

文|黄乐平 陈旭东
2025年02月06日 10:14
DeepSeek对算力需求、芯片市场、技术创新、端侧智能、出口管制、投资逻辑、软件生态、开源生态以及中国科技资产估值有哪些影响
DeepSeek。图:视觉中国

  DeepSeek的横空出世引发了AI产业的深刻讨论。本文就DeepSeek对算力需求、芯片市场、技术创新、端侧智能、出口管制、投资逻辑、软件生态、开源生态以及中国科技资产估值等十个关键问题进行了深入分析。

  问题1:DeepSeek是否会抑制算力增长

  据DeepSeek V3技术报告,V3模型的训练总计只需要278.8万GPU小时,相当于在2048卡的H800GPU集群上训练约2个月,合计成本约557.6万美元,相较而言,Llama 3系列模型的计算预算则多达3930万 H100 GPU小时,DeepSeek训练成本约相当于Llama 3系列模型的7%。

责任编辑:张帆 | 版面编辑:王影

推广

财新网主编精选版电邮 样例
财新网新闻版电邮全新升级!财新网主编精心编写,每个工作日定时投递,篇篇重磅,可信可引。
订阅