数据我闻机构订阅会议 Promotion 应用下载帮助网上有害信息举报专区

财新传媒

观点 > 财新名家 > 名家/新秀 > 赵坚 > 正文

发表评论
分享到微信朋友圈
新浪转发

订阅
电邮

DeepSeek的技术创新：基于相邻可能理论的分析

2025年02月24日 15:38

传统AI堆算力的增长方式正在做大量无用功，在算法上存在需要探索的超大相邻可能空间，这正是DeepSeek的意义所在

: DeepSeek通过算法创新重构了AI技术演化的“相邻可能”空间。图：IC photo

一、引言

　　DeepSeek-R1在数学和推理任务上达到了与 OpenAI o1相当的水平，而服务价格只相当于OpenAI o1的1/30。这不仅引起科技界和AI公司的震动，而且在资本市场掀起剧烈震荡。特别引起我兴趣的是，DeepSeek团队在论文中报告他们的全新推理模型出现了连他们自己都没有预料到的“aha moment”（啊哈时刻）。DeepSeek-R1-Zero训练中间版本的数学推理中出现了这样的内容，“Wait, wait. Wait. That’s an aha moment I can flag here.”(等等，等等。等等。这是我可以在这里标注的啊哈时刻)。当发现当前的解题思路可能存在问题时，DeepSeek会停下来，重新审视之前的推理过程，然后尝试寻找新的解决方案。这种行为完全是自发产生的，而不是通过人工设计实现的，这表明DeepSeek在一定程度上已经具备了人的逻辑推理能力。

　　推荐进入财新数据库，可随时查阅宏观经济、股票债券、公司人物，财经数据尽在掌握。

责任编辑：张帆 | 版面编辑：刘潇

版权声明：观点频道所发布文章及图片之版权属作者本人及/或相关权利人所有，未经作者及/或相关权利人单独授权，任何网站、平面媒体不得予以转载。财新网对相关媒体的网站信息内容转载授权并不包括上述文章及图片。文章均为作者个人观点，不代表财新网的立场和观点。

推广

图片推荐

特朗普亮出F-22、F-35和B-2轰炸机迎普京但没谈成任何协议

视线｜普利策获奖记者被以军空袭身亡以方称其为哈马斯成员

视线｜为什么是阿拉斯加？沙皇卖给美国的领土成为特普会之地

10秒内4谢特朗普泽连斯基时隔半年穿黑正装再入白宫

以色列数十万人罢工游行要求停火救人质

台风“杨柳”残余环流深入内地多地迎暴雨城区内涝

一周天下｜特朗普将与普京会晤、首届人形机器人运动会在京举行

泽连斯基特朗普会晤前夕俄大规模空袭乌克兰致10死

视听推荐

【财新时间】彭文生：规模经济如何定义中国未来？

彭文生：技术进步难解需求不足困局

技术越先进，岗位可能越少？彭文生劝年轻人别只盯风口

【特别呈现】航空业“降本降价”，为何它能做到既花钱也赚钱？

为何此时再谈“规模经济”？

亚洲愿景论坛2025将于9月11-13日在新加坡举办

【预告】《财新时间》对话彭文生：规模经济如何定义中国未来？

彭文生：稳定币监管难题在于“产融分离”边界

北京交通大学中国城镇化研究中心教授，主要研究领域为交通运输与国民经济关系研究，集聚经济与城市化，产业组织与企业理论。

赵坚最新文章

DeepSeek的技术创新：基于相邻可能理论的分析

建设统一开放交通运输市场，铁路运输管理体制改革是关键

沪苏地铁“有缝连接”，直通运营为何难

经济增长的主要源泉是什么

规划不合理阻碍中国大城市高质量发展

最新文章

财新网所刊载内容之知识产权为财新传媒及/或相关权利人专属所有或持有。未经许可，禁止进行转载、摘编、复制及建立镜像等任何使用。
京ICP证090880号京ICP备10026701号-8 | 网信算备110105862729401250013号 |

京公网安备 11010502034662号
广播电视节目制作经营许可证：京第01015号 | 出版物经营许可证：第直100013号
Copyright 财新网 All Rights Reserved 版权所有复制必究
违法和不良信息举报电话（涉网络暴力有害信息举报、未成年人举报、谣言信息）：010-85905050　13195200605 举报邮箱：laixin@caixin.com

关于我们 | 加入我们 | 啄木鸟公益基金会 | 意见与反馈 | 提供新闻线索 | 联系我们 | 友情链接