[本篇论文由5var5VAR论文频道为您收集整理,5VAR论文频道http://paper.5var.com将为您整理更多优秀的免费论文,谢谢您的支持]
唐家龙,南开大学人口与发展研究所,博士研究生
一、研究背景
迁移者的个体特征会对迁移的决策行为产生重大影响。然而,由于迁移涉及迁移者在至少两个时点和两个地点上的变动,使得迁移研究变得更为复杂。因为研究对象的部分特征(年龄、婚姻状态等)会随着时间的变化而发生改变,忽略这种时变性因素容易在方法论上出现谬误,从而影响研究结果的可靠性。国内学者对此已有关注,一些文献也指出应当注意时变性变量对研究结果的影响。例如,段成荣(2000)指出,在国内研究迁移决定因素的文献中,在方法论上有一个共同的特点,就是用调查时点上的个人特征来研究人口迁移行为。他认为,这种处理忽略了时变性变量带来的“同时性偏差”,有时会导致变量之间的虚假关系。而正确处理同时性偏差,将有助于消除这种虚假关系,同时还能够增强统计模型的解释力度。
从国内研究来说,忽略时变性因素的主要原因是中国研究资料多为截面数据,较少有调查对迁移者进行连续的长期追踪,从而忽略时变性因素是一种不得已的选择。尽管如此,笔者认为,在数据资料具备消除时变性特征影响的结构时,应当进行有关的数据处理,以充分反映迁移发生时被调查对象的真实特性。目前来看,1987年全国人口调查、1988年全国生育节育抽样调查和2000年全国人口普查(简称“五普”数据)中的迁移数据就具有这样的结构,能够反映出被调查者发生迁移的时点和时变性特征。
本文利用“五普”数据,通过数据处理与模型分析结果的比较,希望明确迁移选择性与时变性因素之间的关系,以及挖掘更深层次的信息。
二、资料来源
本文利用“五普”0.95‰的微观数据来进行分析,其中蕴涵了本研究所需要的必要信息。由于“五普”0.95‰的样本量非常大,为此笔者对其进行了10%的随机抽样,得到初步的样本量为118 324个。为了讨论的方便,在本研究中将主要对1998~2000年间15岁及以上人口发生的省际迁移行为进行分析,对在1998年前发生的跨省迁移行为将不视为迁移。同时,本文将只关注影响跨省迁移决策的4种个人因素,即年龄、性别、婚姻和教育水平,其中只有性别是非时变性变量,并在样本中进一步剔除了年龄在15岁以下的人口,最终用于分析的样本量为90 686个。
三、迁移数据中时变性因素的处理方法
根据笔者所了解的情况,处理截面迁移数据的方法有多种,下面主要就3种方法进行探讨。第一种方法可以称为调查时点法。这是国内迁移研究文献中使用较多的办法,即按被调查者在调查时点的信息来确定变量的值。第二种方法可以称为局部倒推法,仅仅将发生迁移行为的人还原到迁移发生时的状态,利用调查数据中的有关信息来倒推迁移者在迁移发生时的属性。这样能够准确地把握迁移者在做出迁移决策时的人口经济特征。段成荣(2000)采用了这种方法。第三种方法可以称为全面倒推法。这是由Ma等(1997)提出来的人年分解方法①。这种方法与段成荣所用方法的主要区别是:(1)全面倒推法不仅将迁移者随时间而改变的人口经济特征恢复到迁移时点,还将未迁移者随时间而改变的人口经济特征倒推到迁移发生年之初。(2)人年分解方法以年为分割界面,将每个人的信息分年倒推到每年初的状态,从而使每个观测值在每个研究年份形成一套新的截面数据资料,样本量以研究年数为基数增加,形成一套合成的人口数据。郭志刚(1999)在分析省际迁移的离散时间风险模型实例中也提到了类似的人年数据组处理方法,但他的方法对数据结构的要求与“五普”资料不完全相同。
下面以两个具体的观察值为例,更直观地展示3种数据处理方法。
例1:调查对象A,在调查时点上的信息是:年龄为30岁,男性,1999年结婚,1998年时发生了省际迁移,教育水平为研究生毕业,数据处理结果如表1所示。
|