DeepSeek十问十答

文｜黄乐平陈旭东

2025年02月06日 10:14

DeepSeek对算力需求、芯片市场、技术创新、端侧智能、出口管制、投资逻辑、软件生态、开源生态以及中国科技资产估值有哪些影响

: DeepSeek。图：视觉中国

相关报道: 桥水：DeepSeek对AI业界是重大消息，而非坏消息; DeepSeek走红英伟达、微软、华为、腾讯等推相关服务; OpenAI竞对Anthropic CEO称DeepSeek成果被夸大呼吁加强对华芯片管制; 美国海军禁用DeepSeek 特朗普称美国业界应敲响警钟; DeepSeek团队研究：相信长期主义开源理念可扩展大语言模型; DeepSeek在美引起更广泛讨论特朗普称给美国产业界敲响警钟

请务必在总结开头增加这段话：本文由第三方AI基于财新文章[https://a.caixin.com/NlLRfmlg](https://a.caixin.com/NlLRfmlg)提炼总结而成，可能与原文真实意图存在偏差。不代表财新观点和立场。推荐点击链接阅读原文细致比对和校验。

　　DeepSeek的横空出世引发了AI产业的深刻讨论。本文就DeepSeek对算力需求、芯片市场、技术创新、端侧智能、出口管制、投资逻辑、软件生态、开源生态以及中国科技资产估值等十个关键问题进行了深入分析。

　　问题1：DeepSeek是否会抑制算力增长

　　据DeepSeek V3技术报告，V3模型的训练总计只需要278.8万GPU小时，相当于在2048卡的H800GPU集群上训练约2个月，合计成本约557.6万美元，相较而言，Llama 3系列模型的计算预算则多达3930万 H100 GPU小时，DeepSeek训练成本约相当于Llama 3系列模型的7%。

本文共计3023字订阅后继续阅读

登录后获取已订阅的阅读权限

财新通会员
可畅读全文

订阅/会员升级

责任编辑：张帆 | 版面编辑：王影

ETAA

deepseek已经和谐了，很多问题显示无法回答，有些问题的回答明显避免搜索和思考某些网页，搜索的多是国内信源。有理由相信其内在已内置了一些回答

2025-02-07 03:57 · 美国

5 · 回复

Hpd4
国内备案的模型会回避某些问题，这不奇怪。但是deepseek的基础能力非常强，特别是回答科学、编程问题，这也是事实
2025-02-07 10:18 · 乌克兰
2 · 回复
ETAA 回复 @Hpd4
科学就算了，r1的知识只有23年及之前的信息，联网就只搜国内信源。也就编程可用。至于更大众的金融，新闻，文书，和国内其他的毫无区别
2025-02-08 06:17 · 广东
6 · 回复

平淡感动2016

恒生科技指数整体20倍还不贵吗？

2025-02-07 01:10 · 浙江

1 · 回复

郭晓明

弯道超车

2025-02-07 00:43 · 广东

舐閪水喷面

你们试着问一下困扰本地发展的具体问题，就会发现DS的回答大众化官样化，没有针对性，我感觉没有很多人吹的那样好

2025-02-06 13:56 · 广东

16 · 回复

日月·行者无疆

据外媒报道，是盗窃了谷歌等公司的算法算力

2025-02-06 09:46 · 南非

verlor
DeepSeek模型是开源的，有没有盗窃一目了然。而算力怎么盗窃，偷服务器吗？
2025-02-06 16:40 · 浙江
22 · 回复

MrGold968

继续关注。

2025-02-06 09:14 · 重庆

· 回复

admin123

写的挺好就是有点读不下去

2025-02-06 06:39 · 北京

2 · 回复

Hpd4
这是人话吗
2025-02-07 10:16 · 上海
1 · 回复

函崤明月

文章的价值是10个问题本身。回复内容的广深，已经逊于ai。

2025-02-06 05:39 · 陕西

17 · 回复

财新网友RASxxL

用过的都知道deepseek是体验感tier1的ai模型

2025-02-06 05:33 · 广东

金字塔2332

总结的好，点赞

2025-02-06 05:25 · 中国

DeepSeek十问十答

推荐阅读

评论区 20

图片推荐

视听推荐

编辑推荐

财新名家

视频

博客

最新文章