财新传媒


让美国AI圈陷入恐慌的DeepSeek,是颠覆者还是好学生

2025年01月28日 10:36
DeepSeek的低成本神话,是数据优化和算法优化上的一次成功尝试,但非技术上的颠覆性突破。过度解读其意义,不利于中国人工智能的健康发展
资料图:Deepseek。图:视觉中国

  “AI界的拼多多”又放大招了。

  继2024年12月底推出训练成本仅为OpenAI同类模型的1/10的DeepSeek-V3后,仅仅过了两周,中国初创公司深度求索又推出了DeepSeek-R1大模型,在声明中,DeepSeek表示,DeepSeek-R1在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。

  这一消息震动了全球AI圈。

  一位Meta的工程师在美国科技公司员工社区Blind中这样写道,“Meta的生成式AI部门正处于恐慌中。这一切始于DeepSeek,它使得 Llama 4在基准测试中已经落后。”

  推荐进入财新数据库,可随时查阅宏观经济、股票债券、公司人物,财经数据尽在掌握。

责任编辑:张帆 | 版面编辑:刘春辉

推广

于达维
毕业于北京大学地球物理系,美国怀俄明大学大气物理专业硕士,曾从业媒体20余年,为资深科技记者及研究者。