财新传媒

AlphaGo Zero对社会行为仿真模拟的启示

2017年10月31日 10:16 来源于 财新网
可以听文章啦!
被阿尔法元证实的人工智能自学能力对社会层面宏观预测和管控有重要的启示,其对提高中国政府社会治理能力和实现社会管理科学化的意义应该引起有关部门的高度重视
张小彦
财新网“决策智能”专栏作家。20世纪80年代由费孝通先生推荐赴美留学。1989年获匹兹堡大学社会学博士。二十多年来遵循费老“社会学为社会服务”的教诲,将社会科学与现代信息技术相结合开发社会管理和决策支持软件系统。曾为美国联邦政府和二十几个州政府设计、建立了毒品滥用预防活动管理信息系统。2007至2010年,被美国卫生部聘为毒品滥用预防和治疗研究中心国家级顾问;同年,获得国家预防网络授予的服务金奖;2008年获得了美国安永企业家东部地区年度奖;2010年被匹兹堡地区商业周刊评为行业标兵。现任美国匹茨堡大学客座教授并兼任一家软件公司董事长和数据科学家。

  【财新网】(专栏作家 张小彦)最近报道的阿尔法元(AlphaGo Zero)仅用三天自学成才达到目前人类围棋最高水平,震惊世界。更为重要的是它在零数据输入的状态下完成了这一任务,而不像上一代阿尔法狗 (AlphaGo) 通过学习海量人类的棋谱。

  围棋游戏有棋盘,有规则,胜负明确,目标单一,其本质是透明规则的数学计算。实际生活,特别是社会管理决策就没那么简单了。但是,被阿尔法元证实的人工智能自学能力却对社会层面宏观预测和管控有重要的启示。

  如果把物理空间和社会文化氛围比作棋盘,每个在其中生活的人就是棋子。每个人都能根据个人的智商、能力、知识处理信息然后做出适合自己情况的行为决定。个人的行为会受到法律、环境、道德、财力、经历、健康等各方面的约束和限制。从社会层面管理角度来看,仅凭经验和历史数据进行决策和管理处在一个被动的位置。事发之后采取应对措施,然后总结经验的方法不但费时,而且要付出很大的前期代价。

  应用人工智能的方法建立数学模型,在一个虚拟的社会按照行为规律通过仿真模拟预测民众对突发事件的反映,预演不同干预措施可能产生的效果,则可使决策者在低代价、零数据的情况下实行科学的智能决策。就像阿尔法元在虚拟的围棋盘上按照围棋规则下棋而成为顶尖棋手一样。在这个思维理念指导下发展起来的科研领域就是社会行为仿真模拟。

  美国在这方面的科研已有多年历史和长足的进展,特别是在传染病扩散仿真模拟方面已取得了突破性的成果。

  传染病病源是不定和多变的,因此需要一个能够应对病源和扩散方式变化动态建模、实时互动的仿真模拟架构(Framework)。由匹兹堡大学公共卫生学院联手卡耐基梅隆大学计算机学院于2013年研发出的FRED (A Framework for Reconstructing Epidemiological Dynamics) 正是这样一套传染病传播仿真模拟的开源软件系统。FRED是建立在3个模型互动的设计理念之上的。第一,携带者模型(Agent Model)。任何一种传染病都需要通过病源携带者来传播。每个携带者有各种特征如:性别、年龄、就业、上学、收入等;身体状况(健康指标、免疫状况、是否是高危群体等);社会活动场所(住宅、社区、学校、工作单位等);保健行为(是否按期接受免疫,生病时自我隔离等)。第二,场所模型(Place Model)。携带者与无免疫力人的传染接触一定发生在一个场所。最常见的场所包括住宅、社区、学校、工作单位。第三,疾病模型(Disease Model)。每一种传染病都有其特定的发病周期(潜伏期、发病期、传染期等),传染方式(空气传染、接触传染、单次或多次传染等)。

  传染病扩散仿真模拟通过三个模型的互动进行。首先,根据每个携带者的社会特征,可以预测他每天去不同场所的频度。其次,根据携带者在患病的不同阶段(潜伏、发病、恢复、治愈)可预测其传染力的强度。接下来我们可以根据每个携带者的在不同活动场所出现频度和其传染力强度模拟传染病的扩散。对传染病扩散节制的两个重要因素是健康人群的免疫程度和应急部门的管控措施。通过设置免疫程度的参数(75%、80%、95%等)和选择不同控制措施(关闭学校、制止携带者上班等)决策者可以用FRED进行仿真模拟来评估和选择最佳疾控方案。

  FRED仿真模拟是在以美国人口普查数据为基础产生的合成人口(Synthetic Population)上进行的。目前已做到可以对美国全部3000多个县进行县一级的模拟。模拟时间变化周期是一天。FRED的使用者包括科研单位、疾控应急管理部门、政府公共卫生管理和计划部门。作为一个开源软件系统,FRED正在不断收集各方反馈中继续提高和改进。

  中国在社会行为仿真模拟的科研目前还处在探索阶段。通过在覆盖面最广、最具权威性的中国知网(CNKI)的搜索发现,用“社会行为仿真模拟”关键词搜寻未得到任何结果。用“仿真模拟”搜寻,得到一批结果,但都是关于应用计算机仿真模拟技术在春运、突发事件人口疏散、电子游戏、军事、刑警、培训和教学等方面的应用研究。

  虽然美国在社会行为仿真模拟方面的科研走在世界前沿,但美国联邦制度造成的各级政府之间的制约使社会行为仿真模拟成果很难在宏观层面实施应用。而中国的中央集权行政体系则具有强大的自上而下数据采集和监控的能力。如果将美国社会行为仿真模拟科研成果与中国强大的监控和执行能力相结合,并应用大数据技术实现人工智能与实时数据反馈互动,将可能利用后发优势,弯道超车,建立世界领先的智能决策系统。

  社会行为仿真模拟的研究及其对提高中国政府社会治理能力和实现社会管理科学化的意义应该引起有关部门的高度重视。

  作者为社会学博士,现任美国匹茨堡大学客座教授并兼任一家软件公司董事长和数据科学家

  【财新私房课】王烁对话江铸久,畅谈人工智能之于围棋的未来,点击查看课程详情

责任编辑:张帆 | 版面编辑:张翔宇
财新传媒版权所有。如需刊登转载请点击右侧按钮,提交相关信息。经确认即可刊登转载。
全选

新闻订阅:订阅后,一旦财新网更新相关内容,我们会第一时间通过发邮件通知您。

  • 收藏
  • 打印
  • 放大
  • 缩小
  • 苹果客户端
  • 安卓客户端
财新微信