
total by studying the random sample.Sample survey has been widely used in various social and economic fields for investigation and research.In making sample survey to conduct social research,we should make sample column and choose the sampling approach in a scientific and rational way,adopting various approachesto get realinformation as muchaspossible.
Social research;Sample survey;Sample column;Samplingapproach
Abstract:Keywords:题。
调查对象的社会性及人类本身的自然性决定了总体构成的复杂性,即人群体的构成存在着性别、年龄、民族、宗教、党派、文化、职业、地域、语言、习俗、道德、性格、修养、收入、财产等诸多方面的差异,而且一个国家、省、城市、乡镇、村落的人群体内在构成也存在着复杂性。这就使社会研究中抽样调查所面临的总体,需要从不同的标志角度来对其进行剖析研究。
社会问题的研究会涉及到人群体的各个方面,凡是与人类有关的一切问题都可能成为社会研究的调查内容。归类起来看,一类属于人类思想观念和社会意识方面的内容,另一类则属于人的具体言行及由此所造成的实际社会结果方面的内容。有些内容的研究具有历史的永久性,而有些内容的研究具有相对阶段
2、总体构成的复杂性
3、调查内容的广泛性
[摘要]抽样调查是一种根据从总体中随机抽取样本的观察结果来估计和推算总体的调查方法,广泛运用抽样技术已成为各社会经济领域进行调查研究的趋势。在利用抽样调查开展社会研究的过程中,应科学合理地编制抽样框和选择抽样方式,采用多种手段尽可能获取真实信息。
[关键词]社会研究;抽样调查;抽样框;抽样方法[中图分类号]D569[文献标识码]A[文章编号]1671-4326(2005)03-0062-04
抽样调查在社会研究中应用的若干问题探讨
(WenzhouReconstructionCenter of theOldCity,Wenzhou,325000,China)A Discussion on the Application of Sample
Survey in Social Research
(温州市旧城改建指挥部,浙江温州325000)
[收稿日期]2005-06-30
[作者简介]郑温冰(1974-),女,浙江温州人,温州市旧城改建指挥部,统计师,经济师,评估师.
温州职业技术学院学报
ZHENG Wen-bing
郑温冰
抽样调查是一种根据从总体中随机抽取样本的观察结果来估计和推算总体的调查方法。广泛运用抽样技术已成为各社会经济领域进行调查研究的趋势。本文就抽样调查在社会研究中应用的若干问题进行探讨。
社会研究的调查对象是由人所组成的总体。而人是社会的人,受一定政治、经济、文化、宗教、地域、民俗等因素影响,并各自代表着不同的利益主体。不同的利益主体及每一个人的立场观点、信仰和他们(她们)在各种形式的活动过程中的具体行动,就构成了现实的社会问题。这就决定了在应用抽样调查这一方法时,必须从当时当地的具体情况出发,针对所要研究的具体问题来确定调查对象,并依此考虑抽样框编制、样本抽选方法和组织形式、资料收集方式、抽样误差和非抽样误差控制等一系列具体操作问
一、抽样调查在社会研究中应用的特点1、调查对象的社会性
第卷第期53
性。因此,在社会研究中应用抽样调查时,一定要根据研究目的和实际需要来确定调查内容,并以此作为抽样方案设计的依据之一。调查内容的广泛性要求抽样调查应灵活应用。
调查内容的具体化就是调查指标。由于社会调查对象是有思想、有意识、有感情、有私欲,并能出于理性或违反理性选择自己行为的人,因此,每个人总有一些不想被人知道或不被更多人知道的个人秘密或隐私。而社会研究的一个重要任务就是从社会总体的角度去了解具有某类思想特征、或曾有过某类行为、或即将有什么样行为的人所占的比重有多大,以及由此带来了或即将带来什么样的社会后果,这就使调查内容必须涉及到某些个人秘密或隐私,从而使调查指标带有很强的敏感性。部分被调查者出于自我保护的动机会拒绝回答或不真实回答,从而给调查带来困难。
社会问题的调查单位是每一个个人或由个人所组成的特定群体(如家庭)、工作场所(工作单位)、学习场所(学校)等,但人不是固定的物体因而具有流动性。这就是说,在确定了抽样框和所要调查的单位的具体名单后,并不一定能找到所要调查的人或把所要回答的问卷送到被调查者手中,因为被调查者有可能由于临时外出、长期出差、住所搬迁、工作调动等原因而产生“无回答”。因此,在编制抽样框和确定样本容量时,必须考虑这种情况。同时,在访谈调查的时间安排上也要灵活一些,要摸清被调查者的时间安排规律,以提高回答率。
一个严格的抽样框应该是包括且仅包括总体界定范围内的所有抽样单元的名单。对小规模研究,只要有可能,就应按人头建立名单;但对规模较大的研究,这种方法显然是不经济的,通常也是不可能的,往往更依赖一些现成名单。例如,国外社会学者常将电话号码簿、私人汽车号码登记册作为近似抽样框。说它们是近似抽样是因为有些公民并没有电话机或汽车,从而抽样框并不包含它们。如果这部分人的比重很小或只是整个总体中的一个随机样本,则这样做可能不会有显著影响,抽样框仍然有效,否则就可能产生较大的代表性误差,导致抽样失败。
很多情况下,仅依赖一两份名单还是不够的,很多现成名单不能直接作为抽样框。因为现成名单一般
4、调查指标的敏感性
5、调查单位的流动性
二、关于抽样框的编制问题1、利用现成名单
2、对现成名单的加工与修正
是为非调查目的而编制的,它所包含的与调查总体所需要的不一定吻合。所以,不但在现成名单内部要作必要的清理工作(将不属于总体范围内的异类单位剔除出去),甚至还要在好几份名单之间进行“加加减减”,使最后的名单既互不重复又包含调查总体的所有抽样单位。
如果利用现成单位只能作为近似抽样框,对其中可能存在的重复单位、不属于本调查范围的单位及本来已不存在却被列入抽样框的“虚单位”无法消除时,为了降低误差,可以用子总体估计的方法加以修正,即把列入抽样框的属于本调查总体的所有单位作为第一子总体,而将其他单位,包括重复单位、“虚单位”以及不属于本调查总体的单位作为另一个子总体,这样,我们只要对第一个子总体进行估计即可。
一般来说,在以社会组织、社区等为研究客体时,抽样框比较容易编制,因为任何社会组织(企业、学校、等)内部都有一套人事管理体系,而社区(乡镇、城市、国家等)则有相应的户籍管理制度,会有一些现成名单可供编制时参考。但对那些以非正式群体中的一些特殊群体(如青少年犯罪团伙、吸毒卖淫者、未婚孕妇等)为研究客体时,就少有可用的现成名单。若按人头开列他们的名单,即使是小规模研究都很难做到,因为这类群体在社会上扮演的往往是非公开角色,具有活动隐蔽性强、人员流动性强等特点。对这类调查,处理的方法需要更加灵活,如可以采用二次抽样、非概率抽样等。
选择抽样方法和抽样组织方式总的原则有两条:一是尽可能提高样本对总体的代表性;二是尽可能提高抽样调查的经济效益。遵循以上原则,首先要熟悉各种抽样方法和抽样组织方式的适用性、可信度、优点和缺点,然后再根据具体研究项目的要求来决定采用哪一种方法(方式)或哪几种抽样方法(方式)的有效组合。
非概率抽样简便易行,只要研究人员除样本外不打算将自己的调查研究结果普遍化,或者该项研究仅作为一项较大研究的试验,那么非概率抽样是合适的。而对于无法为总体编制抽样框的抽样调查则只能使用非概率抽样。
(1)方便抽样。如果在一项研究中,任何人只要他具有研究所需要的特征,都能作为样本单位,那么就可采用方便抽样。精度上虽会有所损失,但在时间和费用上会得到补偿。
三、关于抽样方法和抽样组织方式的选择问题
1、非概率抽样
第卷第期5363
郑温冰:抽样调查在社会研究中应用的若干问题探讨
(2)判断抽样。如果研究中需要寻找一些异常的个案用于仔细分析是什么使他们产生偏离,就可以选择能充分发挥研究者自身的研究技能和已有知识的判断抽样。
(3)定额抽样。如果需要了解民情(小至城市居民的衣食住行大至国民的社会心态),则应选用定额抽样,通过设计合理的分层标志和各层定额使样本能较好地代表总体。但定额抽样必须以了解总体的性质为基础。
(4)滚雪球抽样。对于那些特殊群体的调查(如吸毒者),最适用的组织方式是滚雪球抽样,因为先找出少数具有所需特征的个体比较容易,再从他们入手找到更多可供调查的个体,如雪球般越滚越大,越来越接近总体。但这种方法只有在个体之间能够并愿意联系时才能实行。
假如我们研究的目的是要根据样本的资料来估计总体数量特征,或检验某种假设(总体的情况),最好采用概率抽样。
(1)简单随机抽样。对于一些规模不大、调查标志差异较小的研究总体,宜直接采用简单随机抽样。
(2)分层抽样。对于调查标志特征差异明显的研究总体,采用分层抽样。因为只有通过分层才能使各类单位都有可能被抽取,从而使样本更具有代表性,这一点与定额抽样的目的是一致的。但各层应抽单位数的多少,应考虑各层的大小和内在构成的复杂程度。例如,有些层虽小但却复杂,这时应多抽;有些层虽大但透明度较高,这时可少抽。若有些层的单位数特别少,但却是调查研究不可忽略的部分,则应特殊处理。
(3)系统抽样。如果规模较大的研究总体,可以采用系统抽样,但要防止出现周期性偏差。尤其对于只能在抽样和访谈过程中才能确定抽样框的,如衔角抽样,则采用系统抽样更为实用。但要注意以下两点:一是符合研究特征的人将以随机的顺序出现;二是在完成抽样的时间期限内会有足够的人选。在确定抽样间距时,也需先对总体数有较准确的估计,否则一旦定得太大,就会在还没取足样本单位之前已无可选的单位。
(4)整群抽样。当研究总体过于庞大,无法掌握总体名单时,最好采用整群抽样。整群抽样显而易见的优点就是大大节省时间和费用,尤其是当总体单位分布区域比较广泛时。但现实社会现象的自然群往往是大小不等,有时群间差很大,所以,以整个群作为抽样单位,误差会比较大。
在实际工作中,上述提到的抽样方法和抽样组织
2、概率抽样
温州职业技术学院学报方式并不是彼此排斥的,往往相互结合使用。例如,整群抽样中调查群的取得、分层后各层样本单位的取得,都可采用简单随机抽样或系统抽样。许多大规模调查中还可以将分层抽样和整群抽样结合成分层整群抽样,即先对群分层,再在各层中抽群,然后对群中所有的单位进行调查。这样,从各层抽样既能满足整群抽样群间差异小的要求,也符合分层抽样层间差异大的要求,从而达到优势互补的效果。为了提高精度,非概率抽样也可结合概率抽样的某些作法。同样,在抽样过程中,也可根据实际情况利用一些非概率抽样的组织方式以减轻工作量,例如,以定额抽取各层样本单位代替纯随机抽样或系统抽样。对有些调查项目若能在设计概率抽样之前先进行小规模非概率抽样的试验,将有利于完善整个抽样设计方案,从而提高整体的抽样效率。总之,具体的选择都应视特定研究目的、要求、经费、调查对象的特点及所处的社会环境灵活地掌握、处理。
对于如何在敏感性问题上获取真实的信息,是抽样调查在社会研究应用中一个很棘手又很重要的问题。笔者认为至少可以在以下几个方面作些努力:
问卷介绍词的设计应达到这样的效果:一是要使被调查者确信不存在对或错的回答、确信该项调查不会被用于除研究之外的其他任何目的(税收、兵役、诉讼等)、确信他们的回答将被秘密处理。如在问卷封面上说明调查结果只作统计处理,承诺绝不涉及对具体被调查者的本人的看法,且绝对保密,以消除回答者的种种顾虑,当然这还需要通过各种实际的保证措施来达到。二是要使被调查者充分认识到该项研究的价值性以及其所给予合作的重要性,以争取被调查者的知情同意。有经验表明,大多数人愿意协助完成他们认为值得做的、具有价值的研究计划。
问卷设计问题的安排要讲究次序。先由非敏感性问题开始,因为如果一开始就问敏感性问题势必引起回答者的反感和警惕,以致拒绝继续答下去。而若先提非敏感性问题,然后循序渐进,逐步过渡到敏感性问题,被调查者就不会感到那么突然,从而较有可能作出回答,而且即使拒答也影响不到非敏感性问题的调查。如果问卷中存在多个敏感问题,最好将它们错开,如一个敏感问题之后加一个无关的问题,可能有利于改进被调查者的合作态度。同时,还要十分注意提问的技巧,如避免对敏感性问题直接提问或诱导性提问,作出该问题并无规范性意见的假定,指出某种想法或行为即使有违规范也不是异常的,或运用态度量表暗中测量以弱化敏感程度,将提高受访者的诚实
四、关于如何获得真实信息的问题
1、问卷设计
20059年月
[参考文献]
[]
责任编辑:刘文卿[1]梁小筠,祝大平.抽样调查的方法和原理[M].上海:华东师范大学出版社,1989.[2]赵俊康.抽样设计的几个问题[J].山西财经学院学报,1993.
[3]肯尼思・D・贝利.现代社会研究方法[M].许真译.上海:上海人民出版社,1976.[4]宁楚飞.社会调查研究方法[M].上海:上海人民出版社,1988.
[5]李哲夫,杨心恒.社会调查与统计方法[M].北京:人民出版社,1992.
[6]全国教材编审委员会.抽样分层若干问题初探[M].北京:中国统计出版社,1994[7]威廉・G・科克伦.抽样技术[M].张尧庭译.北京:中国统计出版社,1990.[8]尹思・罗伯逊.现代西方社会学[M].郑州:河南人民出版社,1992.[9]任栋.抽样调查技术[M].成都:西南财经大学出版社,1992.[10]张伦俊.社会统计方法[M].北京:中国科学技术出版社,1990.
率,从而得到较好的调查效果。
为了减轻被调查者的心理压力,可以采用“模糊化法”。如在问及收入状况时,作区间化处理,可采用“投影法”,因为常用的投影技术有词组联想法、句子填充法、漫画法等。从调查方式上考虑,对有些敏感性问题来说,邮寄问卷回答的效果要比访谈的效果好,因为当着访谈员的面,被调查者会有更多的顾虑,如日后是否会被访谈员认出,访谈员会不会跟第三者讲起等,而邮寄相对来说匿名性较强(当然,它的回答率可能比较低,而且匿名的可靠程度还要取决于研究人员对邮寄过程中各种细节的处理情况);但对另外一些敏感性问题,如涉及某种不愉快的记忆,就需要有访谈员在场,通过他们耐心细致的说服工作和有技巧性的引导,才能获得被调查者更多的合作与支持。因此,选择何种调查方式也要先对所调查的特定问题作具体分析。有时,将邮寄调查和访谈调查结合使用效果更佳。
被调查者在多大程度上愿意说出一个特别的问题是由情景决定的,而在很大程度上又取决于他对访谈员的印象。所以,一名好的访谈员首先应能给被调查者以可信赖感。由于有些敏感性问题受访谈员特征影响很大,如果能选择一名具有与回答者大致相同特征(如性别、种族、宗教信仰、党派等)的访谈员,则较易与回答者形成一种“以亲密的面对面合作为特征”的交谈关系,从而获得关于敏感性问题的可信资料。
“无回答”是指被抽出的一些样本单位未能提供所需调查的标志特征。当样本单位遗漏、被调查者不在家、或没能力回答和拒绝回答等,都会造成“无回答”。那么,该如何减少“无回答”和处理“无回答”指标值呢?
当察觉有样本单位遗漏时而造成的“无回答”,应立即查漏补缺。例如,在进行地区性的抽样时,一个方法是重新访问一级单位,仔细地编列名册,用它
2、问卷调查
3、选择合适的访谈员
4、采用间接手段
第卷第期53郑温冰:抽样调查在社会研究中应用的若干问题探讨
来进行核对。当主要抽样框是街道地址册时,可以补充抽选一个地区样本,目的是对城市中那些在街道地址册中未能很好包括的部分(新建筑)进行抽样,并在街道地址册中似乎准确的部分寻找出遗漏的地址。对于被调查者不在家或拒绝回答而造成的“无回答”,应规定多次访问的次数,即在任何一个样本单位作为“无法接触”而舍弃之前必须进行访问的最低次数。多次访问能减少“无回答”率,但会增加相应费用。处理“无回答”指标值,通常先将总体分为“回答”层和“无回答”层。如果经估测,这两层的指标值不会存在显著差异,则可将“无回答”层的样本单元看成总体的一个随机样本。最简便的做法是用定距数据从资料分析中消除全部“无回答”。若要保证原有样本量,则可用“回答”层指标值的平均值代替每一个“无回答”者,而不改变相关系数的统计数值。但是,在很多情况下“回答”与“无回答”层的指标是有差异的。“无回答”者往往集中在受教育程度、社会经历、社会地位等相仿的或有某种共同利益的人群中,很可能就是总体的某一特殊层。为了不失去该类信息,可采用汉森与赫维茨(Hansen,Hurwltz)1946年提出的办法,即在“无回答”中抽取随机子样本,尽可能调查子样本中的每一个人,得出“无回答”层的样本资料,再结合“回答”层来推断总体。
此外,还可以利用一个或多个辅助变量,用比率估计法来处理“无回答”问题。例如,研究青少年犯罪率时,在抽取的100名青少年中,可能有80名回答,20名未回答。根据常识推断,未回答者中有犯罪行为的比重会更大,这时要想估计全体青少年中有犯罪行为的比重,就可以以有问题家庭(如单亲、失去双亲、家庭不和睦等)所占的比重为辅助变量作出比率估计,因为青少年犯罪行为的产生与家庭环境有高度相关关系。当然,所选的辅助变量应该是容易取得准确资料的,并且其推断效果取决于它跟调查变量之间的相关密切程度。通常情况下,比率估计的效果是好的,尤其是在“回答”层与“无回答”层之间的差异较大的时候。
65
