DeepSeek的横空出世引发了AI产业的深刻讨论。本文就DeepSeek对算力需求、芯片市场、技术创新、端侧智能、出口管制、投资逻辑、软件生态、开源生态以及中国科技资产估值等十个关键问题进行了深入分析。
问题1:DeepSeek是否会抑制算力增长
据DeepSeek V3技术报告,V3模型的训练总计只需要278.8万GPU小时,相当于在2048卡的H800GPU集群上训练约2个月,合计成本约557.6万美元,相较而言,Llama 3系列模型的计算预算则多达3930万 H100 GPU小时,DeepSeek训练成本约相当于Llama 3系列模型的7%。