财新传媒

智能时代:未来已来

2017年09月20日 11:58 来源于 财新网
可以听文章啦!
机器智能的概念已经被提出来60多年,但是真正的突破却在具有大数据的今天
周文渊
周文渊:华创证券投资决策委员会委员,固定收益部副总经理。主要研究领域为金融市场、货币理论和固定收益市场。

  【财新网】(专栏作家 周文渊)《智能时代》是吴军先生继《数学之美》、《文明之光》之后的又一力作,三部曲振聋发聩,既展现了科技之美,又饱含着人文关怀。《智能时代》是一本科普性的专著,作者科技哲学、科学史、工业史信手拈来,以大量的案例通俗易懂地展示了六十多年来人工智能、大数据革命的发展图景,将确定性世界演化为不确定性,进一步衍生出大数据驱动的智能时代序幕开启。

  数据是文明的基石

  人类文明的发展从最初的多神教到一神教,再到中世纪的千年轮回,以至于文艺复兴和近现代的工业文明,发展程度的高低标准是人类对客观世界的认知度和人类和客观世界联系的复杂度。而在作者看来,人类的进步就是靠使用知识不断地改变我们的生活和周围的世界,而数据是知识的基础;因此数据是文明的基石,人类对它的认识也反映了文明的程度。

  人类文明的进程其实伴随着如图所示的过程:

1

  数据本身是客观存在的,但是它的范畴随着文明的进程不断变化和扩大。在西方很多物理学家看来,上帝在创造这个宇宙时,将很多信息埋藏在了黑暗之中,他们的工作就是找到这些信息,并且用数据把它们描述清楚。

  吴军对中世纪天文学家托勒密推崇备至。托勒密在近代之前是当之无愧的最伟大的天文学家,除了地心说,托勒密发明了球坐标、定义了包括赤道和零度经线在内的经纬线,提出了黄道等。托勒密利用数据建立起描述天体运动模型,用40-60个小圆套大圆的方法精确地计算出所有行星运动的轨迹。托勒密认为模型必须与观测数据相吻合,其模型的建立是基于一百多年的观测数据;而依据托勒密的模型,他制定了关于日月星辰位置的《实用天文表》,这和当时的儒略历相吻合,即每年365天,每4年增加一个闰年,多一天。其后1500年,人们根据《实用天文表》来决定农时,正是对于天文的数据积累才正是开启了农业文明的时代。

  不确定性与人工智能理论基础

  人工智能在当今时代出现大爆发的逻辑是什么,60年前的概念为何在今日复兴?正如互联网泡沫一样,人工智能是不是仅仅是一个时髦的噱头,其兴也勃焉其亡也忽焉。在作者看来,人工智能和大数据革命恰恰不是概念炒作,而是代表人类未来趋势,从工业革命、信息革命到智能革命,是人类文明发展进入更高水平的钥匙。

  人工智能和大数据的滥觞是人类因应从确定性世界进入不确定性空间的自然选择。爱因斯坦有句名言:“上帝不掷骰子”,这是他在和量子力学的发明人波尔争论时讲的话。在这场争论中,波尔是正确的,爱因斯坦错了,上帝也掷骰子。世界的不确定性的来自于两个方面,首先是当我们对这个世界的方方面面了解得越来越细致之后,会发现影响世界的变量其实非常多,已经无法通过简单的办法或者公式算出结果,因此宁愿将其定义为不确定因素。第二个方面来自于客观世界本身。量子力学的测不准原理,像电子中央的基本粒子的位置的测量误差和动量的测量误差的不可能无限小。

  不论是因为数据量大导致的不确定性,还是因为世界本身带来的不确定性,世界上有很多事情是难以用确定的公式或者规则来表示的。但是它们并非没有规律可循,通常可以用概率模型来描述。在概率论的基础上,香农博士建立起一套完整的理论,将世界的不确定性和信息联系起来,信息论应运而生。香农在信息论借用了热力学里熵的概念,他用熵来描述一个信息系统的不确定性;可以认为,信息量的度量就等于不确定性的多少。

  信息论完全是建立在不确定性基础上,而要消除不确定性,需要引入信息。用不确定性的眼光看待世界,不仅能够挣钱,而且能够把很多智能型的问题转化成信息处理问题。具体说就是利用信息来消除不确定性的问题。比如下象棋,每一种情况都有几种可能,却难以决定最终选择,这就是不确定性的表现。再比如人脸识别,实际上是可以从有限种可能性挑一种,这就把识别问题变成了消除不确定问题,其本质是把各种智能问题转化成消除不确定性问题。

  正是要解决面临的不确定性,需要大数据、需要数据挖掘、需要机器学习,人工智能和大数据可以大规模降低不确定性,大数据的科学基础是信息论,它的本质就是利用信息来消除不确定性。以信息论和大数据为基础的人工智能也表现出与传统人工智能方法极大的不同,学术界将机器智能分为传统人工智能的方法和现代其他的方法(比如数据驱动、知识发现或者机器学习)。通常传统的人工智能方法有时候会强调为人工智能1.0。传统的人工智能方法是什么呢?简单地讲,就是首先了解人类是如何产生智能的,然后让计算机按照人的思路去做。而当今的人工智能则完全跳出模仿人类的线性思维束缚,通过信息论和大数据极大地提高了人工智能的智力水平。比如现在已经比较成熟的语音识别可以通过信息论的逻辑来提高其智能水平。人的大脑是一个信息源,从思考到找到合适的语句,再通过发音说出来,是一个编码的过程,经过媒介传播到听众耳朵里,是经过了一个信道的信息传播问题,最后听话人把它听懂是一个解码的过程。是一个典型的通信问题,就可以用解决通信问题的方法来解决。

  思维的革命

  人工智能的发展更确定的是代表未来的思维方式的革命。思维方式或者说科学方法是一个文明能否持续演化,持续进步的关键。东方的中国和阿拉伯帝国虽然在工程和技术上不断进步,但是既没有形成科学体系,也没有在方法论方面做出太多贡献。最终发展科学方法的任务留给了笛卡尔和牛顿。笛卡尔的贡献在于提出了科学的方法论,即大胆假设,小心求证,本质上就是机械思维方法。机械思维方法,首先需要一个简单的元模型,这个模型可能是假设出来的,然后再用这个元模型构建复杂的模型;其次,整个模型要和历史数据相吻合。

  从欧几里得到托勒密再到牛顿,在思想方法上可以说是一脉相承而又不断发展的。牛顿不仅把欧几里得通过逻辑推理建立起一个科学体系的方法论从数学扩展到自然科学领域,而且把托勒密用机械运动模型描述天体的规律,扩展到对世界任何规律的描述。牛顿的方法论概括为机械思维,即世界变化的规律是确定的,规律不仅是可以认识的,而且可以用简单的公式或语言描述清楚,这些规律应该是放之四海而皆准。

  机械思维更广泛的影响力是作为一种准则指导人们的行为,其核心思想可以概括为确定性或者可预测性和因果关系。牛顿可以把所有天体运动的规律用几个定律讲清楚,并且应用到任何场合都是正确的,这就是确定性。类似地当我们给物体施加一个外力,它就会产生加速度,而加速度大小取决于外力和物体本身质量,这是一种因果关系。没有这些确定性和因果关系,我们就无法认识世界。

  但是,机械思维的局限性一是人类找到因果关系是一件很难的事情,里面运气成分很大。机械思维更大的局限性来源于它否认不确定性和不可知性。从牛顿开始,人类社会的进步在很大程度上得益于机械思维,但是到了信息时代它的局限性也越来越明显。并非所有的规律都可以用简单的原理描述;其次,像过去那样找到因果关系已经变得非常困难,因为简单的因果关系规律性都被发现了。另外,随着人类对世界认识得越来越清楚,人们发现世界本身存在很多的不确定性。

  机械思维曾经是改变了人类工作方式的革命性的方法论,并且在工业革命和后来全球工业化的过程中起到了决定性的作用,但是我们面临的复杂情况,已经不是机械时代用几个定律就能讲清楚的,不确定性是常态。在无法确定因果关系时,数据为我们提供了解决问题的新方法,数据中所包含的信息可以帮助我们消除不确定性,而数据之间的相关性在某种程度上可以取代原来的因果关系,帮助我们得到想知道的答案,这便是大数据思维的核心。大数据思维和机械思维并非完全对立,它更多的是对后者的补充。

  人工智能:商业化和《1984》

  计算机之所以能战胜人类,是因为机器获得智能的方式和人类不同,它不是靠逻辑推理,而是靠大数据和智能算法。数据驱动人工智能方法最大的优势在于它可以在最大程度上得益于计算机技术的进步。尽管数据驱动方法在一开始数据量不足,计算能力不够时,可能显得有些粗糙,但是随着时间的推移,摩尔定律保证了计算能力和数据量以一个指数级增长的速度递增。相比之下,很多其他方法的改进需要靠理论的突破,因此改进起来周期非常长。在过去的30年里,计算机变得越来越聪明,这并非是因为我们对特定问题的认识有了多大的提高,而是因为在很大程度上我们靠的是数据量的增加。此外,关键技术是启发式搜索算法。蒙特卡罗树搜索算法,它能将搜索的空间限制在非常有限的范围内,保证计算机能够快速找到好的策略。

  科学技术的发展并非是匀速的,以大数据为核心的智能革命之所以在今天爆发,除了在商业上有应用的可能性之外,也是因为很多相关技术已经成熟。机器智能的概念已经被提出来60多年,但是真正的突破却在具有大数据的今天。

  为什么大数据的拐点发生在今天?最容易看到的特征是全球数据量呈爆炸式增长。一是电脑、二是传感器,传感器技术的进步使得收集数据变得非常容易。信息的存储、传递、处理,云计算取得了长足进步。而数据挖掘与机器学习方法日趋成熟。在信息处理领域使用信号与噪声之比的度量来衡量信号的质量。对于那些夹杂着大量噪声的数据,为了提高数据的信噪比,在使用数据之前,需要进行降噪处理,接下来再进行机器学习。机器学习的过程无一例外是一个不断迭代、不断进步的过程。机器学习的算法很多,神经网络算法已经得到了广泛的应用。

  人工智能和大数据的商业化也是水到渠成,一方面是产业智能化。一项技术带动整个社会变革的事情通常遵循的一个模式:新技术+原有产业=新产业;人工智能的发展也会带来原有产业的智能化,即现有产业+机器智能=新产业。未来的农业、制造业、体育、医疗、律师等都将迎来崭新形态。另一个方面是大数据商业的共同点是一切盈利机会尽在数据流中;数据的流向是从枝末的局部到整体,而当我们利用从大数据得到的规律指导商业行为和其他行为时,数据的流向则是从整体到局部。

  当然随着大数据和机器智能的不断普及,在造福人类的同时,也会造成非常多的社会问题,主要是数据安全和保护隐私。特别是隐私权,大数据对隐私带来的威胁在于它会在无形中造就出一个奥威尔的《1984》“老大哥”;到了大数据时代,如果真有一个“老大哥”想监控每一个人,其实是可以做到的。

  作者为国泰君安董事总经理、固定收益部研究主管,本文为作者个人观点,不代表所在机构观点 

责任编辑:张帆 | 版面编辑:王永
财新传媒版权所有。如需刊登转载请点击右侧按钮,提交相关信息。经确认即可刊登转载。
全选

新闻订阅:订阅后,一旦财新网更新相关内容,我们会第一时间通过发邮件通知您。

  • 收藏
  • 打印
  • 放大
  • 缩小
  • 苹果客户端
  • 安卓客户端
财新微信