在大数据时代,新的数据形式和数据中变量间的新型复杂关系给计量经济学带来前所未有的挑战,但另一方面也给计量经济学的发展和原创性的理论突破带来千载难逢的机遇。具体地,RIDE 将重点关注以下两个研究方向:
第一,高维非结构化数据建模与应用。这是因为,当前统计和计量模型在处理大数据时,面临两大挑战。首先,80%以上的数据是非结构的(所谓的非结构数据是指没有具体的数据模型来描述的,它是随机和模糊的);其次,数据是高维和非线的。在大数据集中,单个数据的技术价值和经济价值是非常小的,为了从大数据中提取和挖掘到一个有用的信息和结构,必须至少使用该数据集的一个子集,从而使得这个问题变成一个高维(例如 500-5000 维)和非线性的数据建模问题,如何从统计理论层面对相关问题展开探讨至关重要。
第二,时空数据建模与应用。随着社会经济的发展,数据的社会网络和空间相关特性越来越强。在经济、金融、管理、社会学各个领域,除了变量之间有相关性,同一变量的不同样本也普遍存在着依赖关系,这种依赖关系叫做社会网络(Social Network)或者空间相关性(Spatial Dependence)。如何在大数据环境下有效利用这种社会网络和空间相关的信息是 RIDE 未来重要的研究方向,也是当前计量经济学的重要发展方向之一。