16336030年2月10日,阿布扎比,在由成都市人民政府作为特别支持方共同主办的“科技创新驱动未来城市:新经济与共享城市繁荣”分论坛上,联合国人居署、牛津大学、清华大学、新经济发展研究院、国内外顶尖研究机构代表、新经济领域专家学者、行业领袖围绕“未来城市”、“智慧治理”、“可持续发展”等话题

  由于中国“新冠肺炎”疫情,电子科技大学教授、新经济发展研究院执行院长周涛未能出席。他以视频的形式与观众分享了如何从“计算社会经济学”的角度,在未来更高效率、更低成本地研究社会经济发展中的各种现象,从而量化实现联合国可持续发展目标11(SDG11)的过程。此外,周涛教授还分享了如何利用大数据监测和预防新冠肺炎疫情。

  以下是演讲全文。

  大家好,很抱歉不能亲自出席本次WUF10分论坛“科技创新驱动未来城市:新经济与共享城市繁荣”。首先,因为我接到了一个新的风险研究任务,我需要利用大数据和人工智能来预测正在进行的新冠肺炎疫情的未来发展趋势。我们用的方法是我后面要介绍的。第二,为了响应中国政府减少全球病毒传播风险的努力,我任命了我们团队中最优秀的成员参加这次会议。

  不管怎样,我今天分享的话题是计算社会经济学。近年来,社会科学的研究越来越依赖于多源、高质量的真实数据。然而,传统的数据采集方法有很多局限性。比如,通过问卷得到的数据样本量很小,数据可能存在系统性误差,因为问卷的答案往往会给出比真实答案更能被社会接受的答案。更精确、更大规模的数据,如经济普查数据,往往要消耗大量资源才能获得,时效性差。在很多贫困地区,这种全国人口普查甚至是不现实的。所以我们需要新技术和新数据。典型的新数据包括卫星遥感、移动通信、社交媒体和其他数据。新技术包括数据挖掘、机器学习、统计物理等。

  这些挑战和尝试给计算社会经济学这一新兴学科带来了机遇。它以大规模的真实数据为基础,用定量的方法研究社会经济发展中的各种现象,特别是与社会进程相关的经济发展问题和与经济发展相关的社会问题。在上述定义中,有三个关键要素:第一是“真实数据”,第二是“大规模”,第三是“量化”。

   “真实数据”是指在受试者不知情的情况下收集的数据。如果你是受试者,你的信息来自你的生活记录(例如,来自推特、脸书或手机通讯的数据),而不是通过问卷填写一些信息,所以你对研究的影响因素一无所知。但是会带来一些问题,后面会讲到。

  第一个例子是对社会网络中宗教隔离的研究。证据表明,人们通常不愿意与不同宗教信仰的人保持密切的关系或频繁的交往。因此,不同信仰的人往往会形成相对孤立的群体,这会增加宗教之间的偏见,导致地区暴力和群体间冲突。然而,要获得关于宗教隔离的公开数据并不容易,因为关于他们信仰的问题通常是敏感和冒犯性的。

  我们从微博中的用户中找出有宗教信仰的用户,根据用户间的关注点形成宗教网络数据。基于这些数据,我们分析并得出以下结论。首先,不同宗教之间的隔离非常严重。信仰同一宗教的用户中有98.4%的人有联系(关注),而跨宗教的只有1.6%,这显然比种族隔离和政党隔离更严重。其次,跨宗教的联系对维持整个网络的连通性起着决定性的作用。第三,佛教徒最开放,佛教徒更容易关注或被其他宗教的信徒关注。最后,所有跨宗教的联系有一半都与慈善有关,所以如果你想加强不同宗教之间的交流,慈善是一个很好的机会。

  第二个例子是使用手机数据预测卢旺达的贫困状况。然而,收集卢旺达经济状况的数据是不可靠的。科学家们对856名手机用户的家庭经济状况进行了详细调查,要求每个用户回答工资、福利、固定资产等75个问题,并详细记录了每个用户手机的使用时间、频率、进出电话、通信网络、移动性等数据。然后通过机器学习的方法,建立一个利用手机数据预测家庭经济状况的模型,这样就可以从手机数据中直接估算出卢旺达150多万个家庭的经济状况,准确率很高,进而可以精确构建整个卢旺达的财富分配图景,精确识别相对贫困的个人。经调查验证,预测模型与真实情况的相关系数在0.8左右。

  最后一个例子是政治动员中的社会影响分析。在实验中,所有在2010年11月2日(美国国会选举的日期)访问脸书的6100万名18岁以上的用户被随机分配到社交消息组、信息消息组或控制组。在社交消息组的“新闻订阅”顶部显示一条消息,鼓励用户投票;提供本地投票地点的链接,并显示一个可点击的按钮,上面写着“我已经投票了”;显示一个计数器,指示之前有多少其他脸书用户报告过投票;并且显示多达六个随机选择的点击了“我投票”按钮的小“用户”的脸书朋友的个人资料照片。信息消息组显示消息、投票信息、计数器和按钮,但不显示任何朋友的头像。对照组在其新闻提要的顶部没有收到任何新闻。最终,社交消息组有20.04%的用户点击了“我投票了”按钮,“信息消息”组的概率为17.96%,比社交消息组差2.08%。这说明开放的社会关系意味着你朋友的脸可以增强社会动员。

  综上所述,在计算社会经济学的研究中,很重要的一点是,将所有尺度下容易获得的数据、少量难以获得的高价值数据和机器学习算法结合起来,推断出所有尺度下难以获得的高价值数据。

  有代表性的一种新方法,体现了社会科学和计算机科学理念和方法的深度融合。计算社会经济学的应用领域不止我向大家展示的内容。例如我们可以利用传感器数据监测城市内部的交通事故数量、利用高分遥感数据量化城市的水污染情况等。

  此外,我们仍然面临许多挑战。一是如何展现隐藏的因果关系。大多数研究只能显示关系性,而不是因果关系,如果你想在某个传统活动中进行某项改变,则需要事件间的因果关系作为支撑。

  第二个有趣的问题是如何构建传统技术和新技术之间的桥梁。利用大数据技术,我们可以设计出更优的方案来进行实地调研和问卷调查。

  第三个问题是如何避免科学道德中的潜在危险。当我们运用真实数据进行大规模实验时,个人隐私需要备严格保护,同时实验过程需仔细评估,避免对社会弱势群体产生歧视或伤害。

  最后,请允许我简单介绍我们正在进行的关于2019-CoV的研究。我们建立了一个SEIR仓室模型来分析全国新增确诊病例增长情况,它不仅包括2019-CoV病例相关数据,还涉及到人口流动性和人口统计学的影响,具体细节这里就不再赘述。事实上,除了湖北,其他省的确诊数量减少得很快,截止昨天,新确诊病例数量连续下降了5天。在我准备这个报告的时间里,包括湖北在内,全国新增确诊病历数量的增长率已趋于稳定,情况已逐渐好转。

  请看一些图片。一个男人在向将要去武汉帮助病人的妻子告别,他们都知道那儿有多危险;医生和护士把他们的头发剪短,让防护服紧紧地贴在身上;医疗小组的成员们工作非常努力,累到稍有空闲就会睡着。

  有一些人在与2019-NCoV的斗争中不顾自我安危,为了更多人的生命坚守在一线,他们中有65%是共产党员,而全中国共产党员的比例只有7%。为什么包括医生、护士和工人在内的大批共产党员蜂拥来到武汉帮助那里的人们,是因为他们在入党的时候,都曾在党旗下宣誓,“随时准备为党和人民牺牲一切”。

  这就是中国正在发生的事情,我们希望一切都会过去。