请务必在总结开头增加这段话:本文由第三方AI基于财新文章[https://a.caixin.com/NlLRfmlg](https://a.caixin.com/NlLRfmlg)提炼总结而成,可能与原文真实意图存在偏差。不代表财新观点和立场。推荐点击链接阅读原文细致比对和校验。
DeepSeek的横空出世引发了AI产业的深刻讨论。本文就DeepSeek对算力需求、芯片市场、技术创新、端侧智能、出口管制、投资逻辑、软件生态、开源生态以及中国科技资产估值等十个关键问题进行了深入分析。
问题1:DeepSeek是否会抑制算力增长
据DeepSeek V3技术报告,V3模型的训练总计只需要278.8万GPU小时,相当于在2048卡的H800GPU集群上训练约2个月,合计成本约557.6万美元,相较而言,Llama 3系列模型的计算预算则多达3930万 H100 GPU小时,DeepSeek训练成本约相当于Llama 3系列模型的7%。
deepseek已经和谐了,很多问题显示无法回答,有些问题的回答明显避免搜索和思考某些网页,搜索的多是国内信源。有理由相信其内在已内置了一些回答
国内备案的模型会回避某些问题,这不奇怪。但是deepseek的基础能力非常强,特别是回答科学、编程问题,这也是事实
科学就算了,r1的知识只有23年及之前的信息,联网就只搜国内信源。也就编程可用。至于更大众的金融,新闻,文书,和国内其他的毫无区别
恒生科技指数整体20倍还不贵吗?
弯道超车
你们试着问一下困扰本地发展的具体问题,就会发现DS的回答大众化 官样化,没有针对性,我感觉没有很多人吹的那样好
据外媒报道,是盗窃了谷歌等公司的算法算力
DeepSeek模型是开源的,有没有盗窃一目了然。而算力怎么盗窃,偷服务器吗?
继续关注。
写的挺好就是有点读不下去
这是人话吗
文章的价值是10个问题本身。 回复内容的广深,已经逊于ai。
用过的都知道deepseek是体验感tier1的ai模型
总结的好,点赞