
经济数据根据其性质大致分为三类,它们分别是横截面数据、时间序列数据和面板数据。
横截面数据,指在同一时间点上多个经济个体变量的取值,主要体现不同对象的个体差异。在估计横截面数据模型时,可能遇到的主要问题是异方差性。例如,2012年中国各省份的GDP。
时间序列数据,是某个经济个体变量在不同时间点上的取值,时间间隔可以是等间距或不等间距。时间序列模型的估计中可能存在的主要问题是自相关性。时间序列法是一种定量预测方法,在统计学中广泛应用。如1978-2012年山东省每年的GDP。
时间序列可以分为平稳序列和非平稳序列。平稳序列不存在趋势,而非平稳序列包含趋势、季节性或周期性。例如,某城市连续多年的月平均气温数据属于非平稳序列。针对不同类型的时间序列,预测方法不同。平稳时间序列常用移动平均法和简单指数平滑法拟合,观测值多于50个时通常采用ARIMA模型。非平稳时间序列首先确定包含的成分,然后用适当模型拟合,如含有趋势、季节和循环成分的时间序列采用分解预测。
设定时间序列模型需要考虑模型的函数形式、变量的滞后结构和误差项的相关性结构。时间序列建模的目标是分析数据并建立模型进行预测。时间序列数据是按时间顺序收集的数据,用于描述现象随时间变化。
进行时间序列分解时,一般将时间序列分解为长期趋势、季节波动、循环变动和不规则变动四大类。
面板数据是由多个经济个体在不同时点上的变量取值组成的,如1978-2012年中国各省份每年的GDP。从容量为N的截面样本中,对每个个体观测T个时间单位(T>1),形成一个NT容量的新样本,称为面板数据或时间序列截面数据。面板数据结合了截面和时间维度的变化规律和特征,是截面上个体在不同时间的重复观测数据。