财新传媒
财新传媒
1111111
财新通行证
T中

DeepSeek的技术创新:基于相邻可能理论的分析

2025年02月24日 15:38
赵坚
赵坚

北京交通大学中国城镇化研究中心教授

传统AI堆算力的增长方式正在做大量无用功,在算法上存在需要探索的超大相邻可能空间,这正是DeepSeek的意义所在
news 原图 DeepSeek通过算法创新重构了AI技术演化的“相邻可能”空间。 图:IC photo

一、引言

  DeepSeek-R1在数学和推理任务上达到了与 OpenAI o1相当的水平,而服务价格只相当于OpenAI o1的1/30。这不仅引起科技界和AI公司的震动,而且在资本市场掀起剧烈震荡。特别引起我兴趣的是,DeepSeek团队在论文中报告他们的全新推理模型出现了连他们自己都没有预料到的“aha moment”(啊哈时刻)。DeepSeek-R1-Zero训练中间版本的数学推理中出现了这样的内容,“Wait, wait. Wait. That’s an aha moment I can flag here.”(等等,等等。等等。这是我可以在这里标注的啊哈时刻)。当发现当前的解题思路可能存在问题时,DeepSeek会停下来,重新审视之前的推理过程,然后尝试寻找新的解决方案。这种行为完全是自发产生的,而不是通过人工设计实现的,这表明DeepSeek在一定程度上已经具备了人的逻辑推理能力。

责任编辑:张帆 | 版面编辑:刘潇

观点频道所发布文章及图片之版权属作者本人及/或相关权利人所有,未经作者及/或相关权利人单独授权,任何网站、平面媒体不得予以转载。财新网对相关媒体的网站信息内容转载授权并不包括上述文章及图片。文章均为作者个人观点,不代表财新网的立场和观点。

推荐阅读
财新移动
说说你的看法...
分享
取消
发送
注册
 分享成功

订阅财新网主编精选版电邮>>