|
第六章 抽樣
〖本章學(xué)習(xí)目的〗 通過本章內(nèi)容的學(xué)習(xí)要掌握以下一系列的知識: 抽樣的概念、抽樣調(diào)查的特點(diǎn);抽樣的基本程序;概率抽樣的概念及其具體的類型;非概率抽樣的概念及其具體的類型。
〖本章學(xué)習(xí)建議〗 首先把握這一章各節(jié)內(nèi)容之間的關(guān)系: 第一節(jié)和第二節(jié)是本章的基本內(nèi)容,這兩節(jié)的內(nèi)容是學(xué)習(xí)和掌握后兩節(jié)內(nèi)容的必要的基礎(chǔ)知識。所以,要花一定的時間和精力把前兩節(jié)的內(nèi)容真正搞懂。其中最重要的是抽樣的一系列的術(shù)語。 在掌握了這兩節(jié)內(nèi)容以后,可進(jìn)入第三和第四節(jié)內(nèi)容的學(xué)習(xí)。這兩節(jié)內(nèi)容的關(guān)系是并列的關(guān)系。它們是進(jìn)行抽樣調(diào)查的兩大類方法。在社會調(diào)查的工作中都有著重要的地位。 本章的內(nèi)容在這門課程中屬于重要的內(nèi)容,在全面掌握的基礎(chǔ)上應(yīng)把這一章作為一個非常重要的部分給以高度的重視。
〖本章參考書目〗 袁方主編,《社會研究方法教程》第七章,北京大學(xué)大學(xué)出版社,1997年版。
〖本章主要知識點(diǎn)〗 本章要掌握的主要知識點(diǎn)有: 抽樣調(diào)查的特點(diǎn) 參數(shù)值和統(tǒng)計值 抽樣的基本程序 概率抽樣的具體的形式 非概率抽樣的具體的形式
〖本章小節(jié)〗 抽樣是一種從調(diào)查對象的總體中抽取一部分調(diào)查對旬作為總體代表的程序,抽樣調(diào)查就是對這些被抽作代表的調(diào)查對象所進(jìn)行的調(diào)查。抽樣中常用到的要領(lǐng)和術(shù)語有:個體與抽樣單位,研究總體與調(diào)查總體,抽樣框,抽樣誤差,參數(shù)值與統(tǒng)計值,置信區(qū)間與置信水平等。 與普查相比,抽樣調(diào)查具有費(fèi)用低、速度快、應(yīng)用范圍廣泛、獲得資料豐富和準(zhǔn)確度高的優(yōu)點(diǎn)。 抽樣的一般程序是:(1)界定研究總體和調(diào)查總體;(2)確定抽樣方法和樣本規(guī)模;(3)進(jìn)行抽樣并對樣本作出評估。 抽樣分為概率抽樣和非概率抽樣兩大類。概率抽樣包括簡單隨機(jī)抽樣、等距抽樣、分層抽樣、整群抽樣、多階段抽樣。 盡管非概率抽樣具有不能由樣本推論總體,無論排除抽樣者主觀因素影響等局限性,但由于它具有方便簡單、省力省錢,并且如果設(shè)計得當(dāng),也能抽到具有相當(dāng)代表性的樣本等優(yōu)點(diǎn)。因此,在社會研究中仍在廣泛應(yīng)用,常的非概率抽樣方法有:偶遇抽樣、配額抽樣、主觀抽樣和滾雪球抽樣。 確定樣本規(guī)模是抽樣設(shè)計的一個主要方面,應(yīng)考慮的因素有:(1)研究的精確度要求;(2)總體的性質(zhì),包括總體規(guī)模和總體內(nèi)異質(zhì)程度;(3)抽樣方法;(4)可用于調(diào)查的人力、財力、物力。
第一節(jié) 抽樣與抽樣調(diào)查
〖基本內(nèi)容〗 由總體中選取一部分代表的過程就是抽樣,所選取的這一部分代表稱為樣本。選取樣本的方法分為兩大類:一類是依據(jù)研究任務(wù)的要求和對調(diào)查對象的分析,主觀地、有意識地在研究對象的總體中進(jìn)行選擇;另一類是依據(jù)概論理論,按照隨機(jī)原則洗選擇樣本,完全不帶調(diào)查者的主觀意識。前者稱為非概率抽樣,后者稱為概率抽樣。在自然科學(xué)中,抽樣一般是指采用概率抽樣方法抽取樣本,但在社會研究中,人們也常常把采用非概率抽樣的大樣本調(diào)查包括在內(nèi)。 抽樣調(diào)查始于1891年的人口調(diào)查,而社會科學(xué)中的抽樣方法則是與政治選舉的預(yù)測一起發(fā)展起來的。目前,它已被廣泛運(yùn)用于社會的各個領(lǐng)域,并逐漸成為社會調(diào)查的主流。與普查相比,抽樣調(diào)查具有下列的優(yōu)越性: 1.調(diào)查費(fèi)用較低。當(dāng)總體包含的研究數(shù)目較大時,普查所需要的費(fèi)用甚巨。而抽樣調(diào)查,由于調(diào)查的僅是總體的一部分,因此,所需要的費(fèi)用比整體調(diào)查要少得多。 2.速度快。調(diào)查全部研究對象比調(diào)查它的一部分要費(fèi)時得多。在迅速提供有關(guān)信息和掌握變動的社會現(xiàn)象方面,抽樣調(diào)查具有很大的優(yōu)越性。 3.應(yīng)用范圍廣。由于上述兩個特點(diǎn),抽樣調(diào)查可廣泛用于各個領(lǐng)域、各個部門、各個課題,而不像普查那樣只限于統(tǒng)計部門或政府部門。 4.可獲得內(nèi)容豐富的資料。為了節(jié)約費(fèi)用,減少工作量,以及適合各地區(qū)的情況,整體調(diào)查通常只了解少量項(xiàng)目。抽樣調(diào)查因調(diào)查對象的數(shù)目遠(yuǎn)較普查少,因此,可以設(shè)置較多的較復(fù)雜的調(diào)查項(xiàng)目,并能集中時間和精力作詳細(xì)的分析。 5.準(zhǔn)確性高。普查的實(shí)施需要大批調(diào)查員,而這些調(diào)查員有許多是缺乏經(jīng)驗(yàn)和專業(yè)訓(xùn)練的,這往往會降低調(diào)查質(zhì)量。抽樣調(diào)查則可以使用少量素質(zhì)較高的工作人員并對他們進(jìn)行充分的訓(xùn)練,還可以在實(shí)地調(diào)查中給予更仔細(xì)的檢查監(jiān)督,調(diào)查資料的處理亦能較好的完成。因此,與普查相比,抽樣調(diào)查的資料更準(zhǔn)確、更可靠。 抽樣調(diào)查之所以優(yōu)于普查,其主要原因于,前者的調(diào)查對象數(shù)目遠(yuǎn)較后者的數(shù)目為少,它只是作為整體的一小部分。但是,這些優(yōu)越性的成立必須依據(jù)下述假設(shè):(1)部分是含于整體之中的;(2)更重要的是,部分與整體有同樣的特征、現(xiàn)象、關(guān)系及過程;(3)部分能夠?yàn)檠芯空咛峁┮粋€有關(guān)群體生活、群體態(tài)度、價值和意見的更為清晰的脈絡(luò)。 抽樣調(diào)查的關(guān)鍵在于:(1)如何判斷一個樣本誤差的大小。不解決這個問題,我們就無法保證樣本推論總體的可靠性。(2)怎樣才抽到一個我們所要求的精度的樣本。如果,我們無法從理論上和技術(shù)上實(shí)際抽出這樣的樣本,那么樣本推論總體就毫無意義。
〖概念辨析〗 概率抽樣和非概率抽樣 選取樣本的方法分為兩大類:一類是依據(jù)研究任務(wù)的要求和對調(diào)查對象的分析,主觀地、有意識地在研究對象的總體中進(jìn)行選擇;另一類是依據(jù)概論理論,按照隨機(jī)原則洗選擇樣本,完全不帶調(diào)查者的主觀意識。前者稱為非概率抽樣,后者稱為概率抽樣。在自然科學(xué)中,抽樣一般是指采用概率抽樣方法抽取樣本,但在社會研究中,人們也常常把采用非概率抽樣的大樣本調(diào)查包括在內(nèi)。
〖重點(diǎn)難點(diǎn)分析〗 抽樣調(diào)查的優(yōu)點(diǎn): 1.調(diào)查費(fèi)用較低。當(dāng)總體包含的研究數(shù)目較大時,普查所需要的費(fèi)用甚巨。而抽樣調(diào)查,由于調(diào)查的僅是總體的一部分,因此,所需要的費(fèi)用比整體調(diào)查要少得多。 2.速度快。調(diào)查全部研究對象比調(diào)查它的一部分要費(fèi)時得多。在迅速提供有關(guān)信息和掌握變動的社會現(xiàn)象方面,抽樣調(diào)查具有很大的優(yōu)越性。 3.應(yīng)用范圍廣。由于上述兩個特點(diǎn),抽樣調(diào)查可廣泛用于各個領(lǐng)域、各個部門、各個課題,而不像普查那樣只限于統(tǒng)計部門或政府部門。 4.可獲得內(nèi)容豐富的資料。為了節(jié)約費(fèi)用,減少工作量,以及適合各地區(qū)的情況,整體調(diào)查通常只了解少量項(xiàng)目。抽樣調(diào)查因調(diào)查對象的數(shù)目遠(yuǎn)較普查少,因此,可以設(shè)置較多的較復(fù)雜的調(diào)查項(xiàng)目,并能集中時間和精力作詳細(xì)的分析。 5.準(zhǔn)確性高。普查的實(shí)施需要大批調(diào)查員,而這些調(diào)查員有許多是缺乏經(jīng)驗(yàn)和專業(yè)訓(xùn)練的,這往往會降低調(diào)查質(zhì)量。抽樣調(diào)查則可以使用少量素質(zhì)較高的工作人員并對他們進(jìn)行充分的訓(xùn)練,還可以在實(shí)地調(diào)查中給予更仔細(xì)的檢查監(jiān)督,調(diào)查資料的處理亦能較好的完成。因此,與普查相比,抽樣調(diào)查的資料更準(zhǔn)確、更可靠。 抽樣調(diào)查之所以優(yōu)于普查,其主要原因于,前者的調(diào)查對象數(shù)目遠(yuǎn)較后者的數(shù)目為少,它只是作為整體的一小部分。但是,這些優(yōu)越性的成立必須依據(jù)下述假設(shè):(1)部分是含于整體之中的;(2)更重要的是,部分與整體有同樣的特征、現(xiàn)象、關(guān)系及過程;(3)部分能夠?yàn)檠芯空咛峁┮粋€有關(guān)群體生活、群體態(tài)度、價值和意見的更為清晰的脈絡(luò)。 抽樣調(diào)查的關(guān)鍵在于:(1)如何判斷一個樣本誤差的大小。不解決這個問題,我們就無法保證樣本推論總體的可靠性。(2)怎樣才抽到一個我們所要求的精度的樣本。如果,我們無法從理論上和技術(shù)上實(shí)際抽出這樣的樣本,那么樣本推論總體就毫無意義。
第二節(jié)? 抽樣的術(shù)語與程序 〖基本內(nèi)容〗 一、抽樣的術(shù)語 (一)個體與抽樣單位 個體是收集住處的基本單位,即分析單位。個體可以是某種類型的人(如青年、婦女等),也可以是家庭、組織、社區(qū)等。抽樣單位往往是多層次的。例如要調(diào)查家庭,可先在一個縣中抽取若干個鄉(xiāng),然后在由這些鄉(xiāng)組成的樣本中抽取某些村,最后從這些村組成的樣本中抽取家庭樣本。這時抽樣單位分別是鄉(xiāng)、村、家庭三種,分別稱為初級抽樣單位,次級抽樣單位和終極抽樣單位。 (二)研究總體與調(diào)查總體 研究總體是在理論上明確界定的個體的集合體。調(diào)查總體是研究者實(shí)際抽取樣本的個體的集合體。 (三)抽樣框 抽樣框又稱為抽樣范疇,是抽取樣本的所有抽樣單位的名單。例如要調(diào)查某一大學(xué)學(xué)生政治課學(xué)習(xí)情況,這時抽樣框就是該校全體大學(xué)生的花名冊。 (四)參數(shù)值與統(tǒng)計值 參數(shù)值是關(guān)于總體中某一變量的綜合描述。統(tǒng)計值則是關(guān)于樣本中某一變量的綜合描述。常用的統(tǒng)計值與參數(shù)值有平均數(shù)、標(biāo)準(zhǔn)差,相關(guān)系數(shù)等等。抽樣調(diào)查的重要內(nèi)容之一就是通過樣本統(tǒng)計值推算總體的參數(shù)值,從而達(dá)到由部分認(rèn)識總體的目的。 (五)抽樣誤差 用樣本的統(tǒng)計值去推論總體的參數(shù)值時,總會存在著偏差,這種偏差就是抽樣誤差。抽樣誤差是衡量樣本代表性大小的標(biāo)準(zhǔn),它主要取決于總體的異質(zhì)性和樣本摶含的個體的多少。一般地說,樣本所含個體越多,代表性就越高,抽樣誤差越小,反之則代表性越低,抽樣誤差越大;總體異質(zhì)性程度越高,含同樣數(shù)目的樣本的代表性越低,抽樣誤差越大,反之,代表性越高,抽樣誤差越小。需要指出的是,抽樣中因誤抄、計算等人為過失和其他一些因違反隨機(jī)原則而產(chǎn)生的誤差并不是這里所說的抽樣的誤差。 (六)置信水平與置信區(qū)間 置信水平是指總體參數(shù)值落在樣本統(tǒng)計值某一區(qū)內(nèi)的概率;而置信區(qū)間是指在某一置信水平下,樣本統(tǒng)計值與總體參數(shù)值間誤差范圍。置信區(qū)間越大,置信水平越高。 二、抽樣的基本程序 (一)界定研究總體和調(diào)查總體 界定研究總體和調(diào)查總體,包括確定調(diào)查對象、調(diào)查內(nèi)容、分析單位(或抽樣單位)、抽樣框等。 在確定了調(diào)查總體和抽樣單位以后,應(yīng)將總體按抽樣單位劃分為各部分,這些部分還必須互不重疊且能合成總體,然后將其毫無遺漏地編制成表,即抽樣框。 (二)設(shè)計和抽取樣本 設(shè)計包括兩個部分,一是確定樣本所含個體數(shù)目即樣本的大小,二是選擇抽樣的具體方法。 (三)對樣本進(jìn)行評估 在開始調(diào)查之前還應(yīng)對樣本進(jìn)行評估,評估樣本的目的是初步檢查樣本對于總體的代表性,以免由于前面步驟中的失誤使樣本偏差太大。評估樣本可以采取收集若干容易得到的資料作為總體和樣本之間的比較的方法。
〖概念辨析〗 1.參數(shù)值與統(tǒng)計值 參數(shù)值是關(guān)于總體中某一變量的綜合描述。統(tǒng)計值則是關(guān)于樣本中某一變量的綜合描述。常用的統(tǒng)計值與參數(shù)值有平均數(shù)、標(biāo)準(zhǔn)差,相關(guān)系數(shù)等等。抽樣調(diào)查的重要內(nèi)容之一就是通過樣本統(tǒng)計值推算總體的參數(shù)值,從而達(dá)到由部分認(rèn)識總體的目的。 2.置信水平與置信區(qū)間 置信水平是指總體參數(shù)值落在樣本統(tǒng)計值某一區(qū)內(nèi)的概率;而置信區(qū)間是指在某一置信水平下,樣本統(tǒng)計值與總體參數(shù)值間誤差范圍。置信區(qū)間越大,置信水平越高。
〖重點(diǎn)難點(diǎn)分析〗 本節(jié)的重點(diǎn)和難點(diǎn)是抽樣誤差的學(xué)習(xí)和理解 用樣本的統(tǒng)計值去推論總體的參數(shù)值時,總會存在著偏差,這種偏差就是抽樣誤差。抽樣誤差是衡量樣本代表性大小的標(biāo)準(zhǔn),它主要取決于總體的異質(zhì)性和樣本摶含的個體的多少。一般地說,樣本所含個體越多,代表性就越高,抽樣誤差越小,反之則代表性越低,抽樣誤差越大;總體異質(zhì)性程度越高,含同樣數(shù)目的樣本的代表性越低,抽樣誤差越大,反之,代表性越高,抽樣誤差越小。需要指出的是,抽樣中因誤抄、計算等人為過失和其他一些因違反隨機(jī)原則而產(chǎn)生的誤差并不是這里所說的抽樣的誤差。 ( 第三節(jié) 概率抽樣 〖基本內(nèi)容〗 概率抽樣就是使總體內(nèi)所有個體具有相同的被抽入樣本的概率,這樣的樣本被稱為隨機(jī)樣本,因此,隨機(jī)樣本是由等概率地隨機(jī)抽取的個體所組成。隨機(jī)抽樣是以概率為依據(jù)的,故而能避免抽樣過程中的人為誤差,保證樣本的代表性。在以各種方式抽取的樣本中,隨機(jī)樣本的代表性最高。 概率抽樣又可以分為簡單隨機(jī)抽樣、等距抽樣、分層抽樣、整群抽樣以及結(jié)合使用上述兩種或兩種以上抽樣方法的多階段抽樣。 一、簡單隨機(jī)抽樣 簡單隨機(jī)抽樣又稱為純隨機(jī)抽樣。它是最基本的概率抽樣,簡單隨機(jī)抽樣對總體中的所有個體按完全符合隨機(jī)原則的特定方法抽取樣本,即抽樣時不進(jìn)行任何分組、排列,使總體中的任何個體都同樣有被抽取的平等機(jī)會,由此可見,為了保證總體中每一個體進(jìn)入樣本的機(jī)會完全相等,首先要保證抽樣框的充分性,如果某些個體被漏掉未登,它們就喪失了進(jìn)入樣本的機(jī)會,這樣一來就破壞了隨機(jī)原則。 我們?nèi)粘I钪薪?jīng)常使用的抓鬮、抽簽等方法都是簡單隨機(jī)抽樣。 簡單隨機(jī)樣本是概率抽樣的理想類型,它從隨機(jī)樣本的抽取到對總體進(jìn)行推斷,有一套健全的規(guī)則。但是,當(dāng)總體所含個體的數(shù)目太多時,采取這種抽樣方法不僅費(fèi)時甚多,而且費(fèi)用太高。 二、等距抽樣 簡單隨機(jī)抽樣的一個變種是等距抽樣,又稱系統(tǒng)抽樣或機(jī)械抽樣,這種抽樣的具體作法是: 1.將總量的所有個體按一定順序排列起來。 2.計算抽樣距離。抽樣距離是由總體所含個體的數(shù)目與樣本所含的個體數(shù)目決定的。假設(shè)前者為N個,后者為n個,則抽樣距離應(yīng)是K=N/n。 3.在頭K個個體中,用完全隨機(jī)的方法抽取一個個體,設(shè)其所在的位置的序號為K。 一般來說,等距抽樣與簡單隨機(jī)抽樣一樣,要對總體中所有個體進(jìn)行順序編號,即要收集總體的名單,但有時也可以不必這樣做,只要總體的排列順序是隨機(jī)的,就可依已排好的次序從中等距抽取樣本。 等距抽樣最適用于同質(zhì)性較高的總體。當(dāng)總體內(nèi)個體類別之間的數(shù)目懸殊過大時,樣本的代表性可能較差。在這種情況下,一般采用另一種抽樣方法,即分層隨機(jī)抽樣。 三、分層隨機(jī)抽樣 (一)分層隨機(jī)抽樣的優(yōu)點(diǎn)與作用 所謂分層隨機(jī)抽樣就是先將總體依照某一種或某幾種特性分為幾個子總體,每個子總體稱為一層,然后從每一層中隨機(jī)抽取一個子樣本,將這些子樣合在一起即為總體的樣本。 分層抽樣的優(yōu)點(diǎn)是: 1.當(dāng)一個總體內(nèi)部分層明顯時,分層抽樣能夠克服簡單隨機(jī)樣和等距抽樣的缺點(diǎn)。 2.分層抽樣可以提高總體參數(shù)估計的精確度。 3.有些研究不僅要了解總體的情況,而且還要了解某些類別的情況。 4.便于行政管理。同一層可看作一個總體,因此每層可由專人進(jìn)行管理。 (二)分層抽樣 分層抽樣可分為按比例分層抽樣和最優(yōu)分層抽樣。在實(shí)際中,通常采用的是按比例分層抽樣,因?yàn)樗^最優(yōu)分層抽樣簡單。所謂按比例分層抽樣就是要求各層子樣本在總體樣本中所占比例與本層在總體中所占的比例相同。 分層抽樣適用于總體內(nèi)個體數(shù)目較多,結(jié)構(gòu)比較復(fù)雜,內(nèi)部差異較大的情況。 四、整群隨機(jī)抽樣 整群隨機(jī)抽樣又稱聚類抽樣。所謂整群抽樣就是將總體按照某種標(biāo)準(zhǔn)劃分為一些子群體,每個子群體作為一個抽樣單位,用隨機(jī)的辦法(如簡單隨機(jī)抽樣、等距抽樣、分層抽樣等)從中抽取若干子群,將抽了的子群中所有個體合在一起作為總體的樣本。 整群抽樣與分層抽樣有相似之處,即它們的第一步都是根據(jù)某種標(biāo)準(zhǔn)將總體劃分為一些子群,但兩者的抽樣方法完全不同。分層抽樣是在所有子群中均要抽取一個子樣本,作為總體樣本的一部分。而整群抽樣則不然,它是抽取若干子群并將抽出的子群中全部個體作為樣本,因此總體樣本只分布在幾個群中。此外,由于抽樣方式的不同,導(dǎo)致兩者之間劃分子群的原則也不相同。在分層抽樣中,由于每層均要選取子樣本作為總樣本的一部分,即在總體樣本中每層均有自己的代表,因而它要求層的劃分具有較高的代表性,即層之間異質(zhì)性高,層內(nèi)則盡可能同質(zhì),研究變量的選擇與研究問題高度相關(guān)。而在整群抽樣中,由于只選擇某幾個子群作為整體的代表,如果子群間差異顯著,且每個子群內(nèi)同質(zhì)性很高,那么在這種情況下,抽取的子樣本顯然無法代表總體。 整群抽樣在優(yōu)點(diǎn)在于:它可以通過變換抽樣單位擴(kuò)大抽樣的應(yīng)用范圍;它可以節(jié)省人、財、物力。 整群抽樣的最大缺點(diǎn)是樣本分布不均勻,樣本的代表性較差。因此與其他抽樣方法相比,在樣本數(shù)相同時,它的抽樣誤差較大。盡管有這些局限性,但由于實(shí)施起來比較方便,而且還可以節(jié)約人、財、物力,在大規(guī)模范圍的調(diào)查中,仍常常采用這種方法。在綜合考慮調(diào)查費(fèi)用和樣本精確度之后,研究者往往會選用整群抽樣。 五、多階段抽樣 在上述整群抽樣中,當(dāng)子群數(shù)和子群內(nèi)部個體數(shù)目較多,而彼此間的差異性不太大時,常常采用更加經(jīng)濟(jì)的方法,即不將樣本子群中的所有個體作為樣本,而是再從中用隨機(jī)抽樣的方法(如簡單隨機(jī)抽樣、分層抽樣、等距抽樣或再次整群抽樣)抽出最終樣本,因最終樣本的獲取經(jīng)過兩次抽樣,我們稱之為二階段抽樣。同樣地,可進(jìn)行三階段,四階段……即多階段抽樣。 采用多階段抽樣,通常在第一階段使用嚴(yán)格的隨機(jī)抽樣方法,而從第二階段起開始使用概率比例抽樣,因?yàn)橹挥羞@樣才能保證總體樣本的隨機(jī)原則。所謂概率比例抽樣是根據(jù)每一群所含個體的多少分配樣本名額。在上述整群抽樣中,當(dāng)子群數(shù)和子群內(nèi)部個體數(shù)目較多,而彼此間的差異性不太大時,常常采用更加經(jīng)濟(jì)的方法,即不將樣本子群中的所有個體作為樣本,而是再從中用隨機(jī)抽樣的方法(如簡單隨機(jī)抽樣、分層抽樣、等距抽樣或再次整群抽樣)抽出最終樣本,因最終樣本的獲取經(jīng)過兩次抽樣,我們稱之為二階段抽樣。同樣地,可進(jìn)行三階段,四階段……即多階段抽樣。 多階段抽樣通過采用由多級抽樣單位過度到終級抽樣單位的方法,解決了終極單位不易獲得的抽樣匡的問題,并且可以使樣本的分布較為集中,從而可以節(jié)約大量的人力和經(jīng)費(fèi)。它特別適用于調(diào)查范圍大、單位多、情況復(fù)雜的調(diào)查對象。
〖概念辨析〗 這一節(jié)的關(guān)鍵是要搞清楚上述五種抽樣方式的區(qū)別,而要真正掌握它們的區(qū)別,最基本的要從概念上把握它們的區(qū)別。 1.簡單隨機(jī)抽樣又稱為純隨機(jī)抽樣。它是最基本的概率抽樣,簡單隨機(jī)抽樣對總體中的所有個體按完全符合隨機(jī)原則的特定方法抽取樣本,即抽樣時不進(jìn)行任何分組、排列,使總體中的任何個體都同樣有被抽取的平等機(jī)會。 2. 簡單隨機(jī)抽樣的一個變種是等距抽樣,又稱系統(tǒng)抽樣或機(jī)械抽樣,這種抽樣的具體作法是: a.將總量的所有個體按一定順序排列起來。 b.計算抽樣距離。抽樣距離是由總體所含個體的數(shù)目與樣本所含的個體數(shù)目決定的。假設(shè)前者為N個,后者為n個,則抽樣距離應(yīng)是K=N/n。 c.在頭K個個體中,用完全隨機(jī)的方法抽取一個個體,設(shè)其所在的位置的序號為K。 一般來說,等距抽樣與簡單隨機(jī)抽樣一樣,要對總體中所有個體進(jìn)行順序編號,即要收集總體的名單,但有時也可以不必這樣做,只要總體的排列順序是隨機(jī)的,就可依已排好的次序從中等距抽取樣本。 3. 所謂分層隨機(jī)抽樣就是先將總體依照某一種或某幾種特性分為幾個子總體,每個子總體稱為一層,然后從每一層中隨機(jī)抽取一個子樣本,將這些子樣子合在一起即為總體的樣本。 分層抽樣可分為按比例分層抽樣和最優(yōu)分層抽樣。 4. 整群隨機(jī)抽樣又稱聚類抽樣。所謂整群抽樣就是將總體按照某種標(biāo)準(zhǔn)劃分為一些子群體,每個子群體作為一個抽樣單位,用隨機(jī)的辦法(如簡單隨機(jī)抽樣、等距抽樣、分層抽樣等)從中抽取若干子群,將抽了的子群中所有個體合在一起作為總體的樣本。 5.多階段抽樣 在上述整群抽樣中,當(dāng)子群數(shù)和子群內(nèi)部個體數(shù)目較多,而彼此間的差異性不太大時,常常采用更加經(jīng)濟(jì)的方法,即不將樣本子群中的所有個體作為樣本,而是再從中用隨機(jī)抽樣的方法(如簡單隨機(jī)抽樣、分層抽樣、等距抽樣或再次整群抽樣)抽出最終樣本,因最終樣本的獲取經(jīng)過兩次抽樣,我們稱之為二階段抽樣。同樣地,可進(jìn)行三階段,四階段……即多階段抽樣。
〖重點(diǎn)難點(diǎn)分析〗 上述這五種抽樣方式的特點(diǎn)及其它們的適用情況 簡單隨機(jī)樣本是概率抽樣的理想類型,它從隨機(jī)樣本的抽取到對總體進(jìn)行推斷,有一套健全的規(guī)則。但是,當(dāng)總體所含個體的數(shù)目太多時,采取這種抽樣方法不僅費(fèi)時甚多,而且費(fèi)用太高。 等距抽樣最適用于同質(zhì)性較高的總體。當(dāng)總體內(nèi)個體類別之間的數(shù)目懸殊過大時,樣本的代表性可能較差。在這種情況下,一般采用另一種抽樣方法,即分層隨機(jī)抽樣。 分層抽樣的優(yōu)點(diǎn)是: 1.當(dāng)一個總體內(nèi)部分層明顯時,分層抽樣能夠克服簡單隨機(jī)樣和等距抽樣的缺點(diǎn)。 2.分層抽樣可以提高總體參數(shù)估計的精確度。 3.有些研究不僅要了解總體的情況,而且還要了解某些類別的情況。 4.便于行政管理。同一層可看作一個總體,因此每層可由專人進(jìn)行管理。 整群抽樣在優(yōu)點(diǎn)在于:它可以通過變換抽樣單位擴(kuò)大抽樣的應(yīng)用范圍;它可以節(jié)省人、財、物力。 整群抽樣的最大缺點(diǎn)是樣本分布不均勻,樣本的代表性較差。因此與其他抽樣方法相比,在樣本數(shù)相同時,它的抽樣誤差較大。盡管有這些局限性,但由于實(shí)施起來比較方便,而且還可以節(jié)約人、財、物力,在大規(guī)模范圍的調(diào)查中,仍常常采用這種方法。在綜合考慮調(diào)查費(fèi)用和樣本精確度之后,研究者往往會選用整群抽樣。 多階段抽樣通過采用由多級抽樣單位過度到終級抽樣單位的方法,解決了終極單位不易獲得的抽樣匡的問題,并且可以使樣本的分布較為集中,從而可以節(jié)約大量的人力和經(jīng)費(fèi)。它特別適用于調(diào)查范圍大、單位多、情況復(fù)雜的調(diào)查對象。
第四節(jié)? 非概率抽樣 〖基本內(nèi)容〗 隨機(jī)抽樣能夠排除調(diào)查者的主觀影響,抽選出較其他抽樣方法更具代表性的樣本,并且能夠確知和控制抽樣誤差的大小,從而使由樣本推論總體和通過對樣本的分析研究達(dá)到對總體的全面認(rèn)識成為可能。但是在很多情況下,這種嚴(yán)格的隨機(jī)抽樣幾乎無法進(jìn)行。此外,有些研究為了符合研究的目的,不得不按照需要從總體中抽取少數(shù)有代表性的個體作為樣本。再者,為了保證隨機(jī)原則,對抽樣和操作過程要求嚴(yán)格,實(shí)施起來比較麻煩,費(fèi)時費(fèi)力。在上述情況下,一般代之以非概率抽樣。非概率抽樣由于各個個體進(jìn)入樣本的概率是未知的,而且排除不了調(diào)查者的主觀影響,因而無法說明樣本是否體現(xiàn)了總體的結(jié)構(gòu),用這樣的樣本推論總體是極不可靠的。但非概率抽樣操作方便,省錢省力,統(tǒng)計上也遠(yuǎn)較概率抽樣簡單,而且能對調(diào)查總體和調(diào)查對象有較好的了解,抽樣也可獲得較大的成功。但是特別應(yīng)當(dāng)指出的是,將非概率抽樣的結(jié)論推論到總體時要極其慎重,否則就容易出現(xiàn)以偏概全的錯誤。非概率抽樣有以下幾種類型。 一、偶遇抽樣 偶遇抽樣又稱方便抽樣,是指研究者將其在一定時間內(nèi)、一定環(huán)境里所能遇見或接觸到的人均選入樣本的方法。 偶遇抽樣的優(yōu)點(diǎn)是方便省力,但樣本的代表性差,有很大的偶然性。 二、主觀抽樣 主觀抽樣的“主觀”有兩種含義,一種是主觀判斷的意思,這時主觀抽樣又稱判斷抽樣或立意抽樣,即研究者依據(jù)主觀判斷選取可以代表衷情體的個體作為樣本, 主觀抽樣的第二種含義是“有目的地”選擇樣本的意思。例如在問卷設(shè)計階段,為檢驗(yàn)問題設(shè)計是否得當(dāng),常有意地選擇一些觀點(diǎn)差異懸殊的人作為調(diào)查對象。 在無法確定總體的邊界或因研究者的時間、設(shè)備有限而無法進(jìn)行抽樣調(diào)查的時候,可以采用這種方法。 三、定額抽樣 定額抽樣又叫配額抽樣,它與分層隨機(jī)抽樣相似,也是按調(diào)查對象的某種屬性或特征將總體中所有個體分成若干類或?qū)?,然后在各層中抽樣?br>定額抽樣是一代表總體為目的,因此,必須對總體的性質(zhì)有充分的了解。一方面由于不可能兼顧總體的眾多的屬性,而只能考慮其中幾種,因此不可能作出很細(xì)的分類;另一方面有關(guān)總體的分布的最新信息并不容易得到,因而配額的合理性很難保證。這些都會影響定額抽樣的樣本的代表性。 四、滾雪球抽樣 滾雪球抽樣是先從幾個適合的樣本開始,然后通過它們得到更多的樣本,這樣一步步地擴(kuò)大樣本范圍的抽樣方法。當(dāng)調(diào)查總體的個體信息不充分時采用這種方法。例如要研究城市的保姆問題,研究者一開始因缺乏總體信息而無法抽樣,這時可先通過各種辦法,如家庭服務(wù)公司、街道居委會或熟人介紹等,找到幾個保姆進(jìn)行調(diào)查,并讓她們提供所認(rèn)識的其他保姆的情況。然后再去調(diào)查這些保姆并請她們提供自己所認(rèn)識的保姆,依次類推。
〖概念辨析〗 要搞清楚這四種抽樣方式的區(qū)別: 偶遇抽樣又稱方便抽樣,是指研究者將其在一定時間內(nèi)、一定環(huán)境里所能遇見或接觸到的人均選入樣本的方法。 主觀抽樣的“主觀”有兩種含義,一種是主觀判斷的意思,這時主觀抽樣又稱判斷抽樣或立意抽樣,即研究者依據(jù)主觀判斷選取可以代表衷情體的個體作為樣本, 主觀抽樣的第二種含義是“有目的地”選擇樣本的意思。例如在問卷設(shè)計階段,為檢驗(yàn)問題設(shè)計是否得當(dāng),常有意地選擇一些觀點(diǎn)差異懸殊的人作為調(diào)查對象。 定額抽樣 定額抽樣又叫配額抽樣,它與分層隨機(jī)抽樣相似,也是按調(diào)查對象的某種屬性或特征將總體中所有個體分成若干類或?qū)?,然后在各層中抽樣?br>滾雪球抽樣是先從幾個適合的樣本開始,然后通過它們得到更多的樣本,這樣一步步地擴(kuò)大樣本范圍的抽樣方法。
〖重點(diǎn)難點(diǎn)分析〗 這四種抽樣方式的特點(diǎn)和適用性 偶遇抽樣 偶遇抽樣的優(yōu)點(diǎn)是方便省力,但樣本的代表性差,有很大的偶然性。 主觀抽樣 在無法確定總體的邊界或因研究者的時間、設(shè)備有限而無法進(jìn)行抽樣調(diào)查的時候,可以采用這種方法。 定額抽樣是一代表總體為目的,因此,必須對總體的性質(zhì)有充分的了解。一方面由于不可能兼顧總體的眾多的屬性,而只能考慮其中幾種,因此不可能作出很細(xì)的分類;另一方面有關(guān)總體的分布的最新信息并不容易得到,因而配額的合理性很難保證。這些都會影響定額抽樣的樣本的代表性。 滾雪球抽樣??? 當(dāng)調(diào)查總體的個體信息不充分時采用這種方法。
第五節(jié) 樣本大小
〖基本內(nèi)容〗 樣本大小又稱樣本容量,指的是樣本所含個體數(shù)量的多少。樣本的大小不僅影響其自身的代表性,而且還直接影響到調(diào)查的費(fèi)用和人力的花費(fèi)。太大的樣本會浪費(fèi)人力、財力,增加工作量;太小的樣本則會降低調(diào)查的效果。因此,樣本大小“適當(dāng)”是非常重要的。適當(dāng)?shù)臉颖疽姥芯磕康?、總體性質(zhì)、客觀條件而定。而客觀條件就是能夠用于這項(xiàng)研究的人力、財力、時間。樣本大小的確定是對這三方面綜合考慮的結(jié)果。 樣本容量指的是樣本中所包括的樣本單位的個數(shù)。如,從一個學(xué)校的學(xué)生中抽選樣本,每個樣本中有30個學(xué)生,則我們說,樣本容量為30。 統(tǒng)計學(xué)中把容量少于30的樣本稱為小樣本,把容量大于30的樣本稱為大樣本。 對樣本的代表性,不同研究有不同的要求,這種要求一般用精確度來衡量,某研究所要求的精確度就是這項(xiàng)研究能允許樣本估計量有多大的誤差。社會研究常選用的誤差界限是5%。 影響樣本代表性的誤差分為兩類,第一類是隨機(jī)誤差,其中包括抽樣誤差,它是由于樣本范圍與總體范圍的不同產(chǎn)生的誤差。第二類誤差是系統(tǒng)誤差,它主要是由于抽樣方法的不科學(xué)所致。因此,如果采用嚴(yán)格的概率抽樣,就可以消除樣本的系統(tǒng)誤差。樣本的大小與抽樣誤差密切相關(guān),樣本越小,與總體差異越大,誤差越大。因此可以得出下述兩個結(jié)論,第一,樣本的大小視研究所要求的精確度而定,對樣本的精確度要求越高,第二,在一定的精確度要求下,總體越大則樣本亦應(yīng)越大。
〖概念辨析〗 樣本容量??? 樣本容量指的是樣本中所包括的樣本單位的個數(shù)。如,從一個學(xué)校的學(xué)生中抽選樣本,每個樣本中有三十個學(xué)生,則我們說,樣本容量為三十。 大樣本和小樣本?? 統(tǒng)計學(xué)中把容量少于30的樣本稱為小樣本,把容量大于30的樣本稱為大樣本。 〖重點(diǎn)難點(diǎn)分析〗 影響樣本代表性的誤差: 影響樣本代表性的誤差分為兩類,第一類是隨機(jī)誤差,其中包括抽樣誤差,它是由于樣本范圍與總體范圍的不同產(chǎn)生的誤差。第二類誤差是系統(tǒng)誤差,它主要是由于抽樣方法的不科學(xué)所致。因此,如果采用嚴(yán)格的概率抽樣,就可以消除樣本的系統(tǒng)誤差。樣本的大小與抽樣誤差密切相關(guān),樣本越小,與總體差異越大,誤差越大。因此可以得出下述兩個結(jié)論,第一,樣本的大小視研究所要求的精確度而定,對樣本的精確度要求越高,第二,在一定的精確度要求下,總體越大則樣本亦應(yīng)越大。
|