
第二節 估計信度的方法
前面已經提出了信度的概念,但只是一個理論上的構想,實際測量過程中,無法對真分數和誤差分數進行測量,在實際應用中,通常以同一樣本得到的兩組資料的相關,作為測量一致性的指標。估計信度有不同的方法,常用的估計的方法有再測信度、復本信度、等值穩定性系數、內部一致性系數、評分者信度等。
一、再測信度(Test-Retest Reliability)
再測信度,也叫重測信度,也叫穩定性系數。用同一個測驗,對同一組被試前后施測兩次,對兩次測驗分數求相關,其相關系數就叫再測信度。其計算公式(皮爾遜積差相關公式的變式)為:
(公式5-6)
式中X1、X2為同一被試的兩次測驗分數,、為全體被試兩次測驗的平均數,S1、S2為兩次測驗的標準差(樣組標準差,參見金瑜的書P183),N為被試人數。
再測法的模式是:施測 適當時距 再施測
例2:假設有一份主觀幸福感調查表,先后兩次施測于10名學生,時間間隔為半年,結果如表所示,求該測驗的重測信度。(為了便于理解和計算,本章估計信度的例子都是小樣組,實際應用時應采用大樣組。)
表5-1 某幸福感調查表的兩次測試結果
測驗 | 被試 |
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
X1 | 16 | 15 | 13 | 13 | 11 | 10 | 10 | 9 | 8 | 7 |
X2 | 16 | 16 | 14 | 12 | 11 | 9 | 11 | 8 | 6 | 7 |
| | | | | | | | | | |
解:用計算器算出
S1=2.82,S2=3.38,,,
把以上數據代入公式5-6,可得
此題可用計算機社會科學統計軟件做,求皮爾遜積差相關。
在測驗手冊上報告的再測信度,一般要注明被試樣本的性質、大小,以及間隔多長時間等,以便使使用者了解樣本及時間因素對測驗穩定性的影響。
計算再測信度必須注意幾個問題:
(1)所測量的特性必須是穩定的。當然絕對的穩定是不可能的,但應該是比較穩定的。所欲測的如果是智力、人格、興趣等心理特質,則可以采用再測法;如果是知識、情緒等心理特質就不能使用再測法,因為這些心理特質是不穩定的。
(2)遺忘和練習的效果基本上相互抵消。
在做第一次測驗時,被試可能會獲得某種技巧,但只要間隔時間適度,這種練習的效果會基本上被遺忘掉。
因此,再測信度要考慮時間間隔的問題。到底多長合適呢?一般來說,相隔時間越長,穩定系數越低。最適宜的時距隨測驗的目的、性質及被試的特點而異。對于年幼兒童,兩次施測的時間間隔應比年紀較大的被試短些,這是因為在個體發展的早期變化較快。一般來說,無論對于那種被試,初測與再測的間隔最好不要超過六個月。
另外,還有一種情況,例如,我們可能在間隔許多年后對被試施測同一個智力測驗,此時我們的目的主要是考察智力隨年齡的發展變化,而不是用來估計測驗的信度。
(3)再測法適用于速度測驗而不適用于難度測驗。
速度測驗題目較多,時間較緊,被試無法記住測驗內容,所以受第一次測驗的影響小,記憶效果可以忽略不計。
(4)應注意提高被試者的積極性。由于再測法是把原測驗原封不動地重測一次,所以被試者容易興趣索然,采取不積極合作的態度,使第二次測驗的質量下降。所以,提高被試者的積極性,使他們如同第一次那樣認真負責地完成測驗,這是再測法計算信度能夠成功的一個重要條件。
由于測驗的再測信度受時間和其它多種因素的影響,故任何一個測驗就可有不止一個再測信度系數。所以在測驗手冊中報告此種信度時應說明時間間隔以及在此間隔中被試的經歷,如有無受過何種教育訓練、心理治療以及有何學習經歷等。
二、復本信度
復本信度(Alternate Form Reliability),也稱等值性系數(Coefficient of Equivalence)。
用兩個平行(等值)的測驗對同一組被試施測,得到兩組測驗分數,求這兩組測驗分數的相關系數,這就是復本信度。因為這反應了兩個測驗的等值程度,因此又稱等值性系數。計算方法與再測法是一樣的。
復本信度的模式是:復本A 最短時距 復本B
例3:假設用A、B兩型創造力復本測驗對初中一年級10個學生施測。結果見表5-2。(此題可以讓學生自己計算)
表5-2 某創造力復本測驗測試結果
測驗 | 被試 |
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
X1 | 20 | 19 | 19 | 18 | 17 | 16 | 14 | 13 | 12 | 10 |
X2 | 20 | 20 | 18 | 16 | 15 | 17 | 12 | 11 | 13 | 9 |
| | | | | | | | | | |
解:先用計算器計算得出以下值:
,,,,
代入公式5-6,得
復本信度應用時應注意以下幾點:
(1)復本信度的關鍵在于兩個量表必須等值,即必須具有相同的難度、區分度、長度、題型等。只有達到這一要求,根據兩次測驗分數求出的復本信度才有意義。施測過程中的條件當然應該一致。
(2)兩次測驗的時距應盡可能短促,以便避免知識的積累、練習效應等因素的影響。最短的時距時在一次測驗中先后用兩個量表施測被試。
(3)由于量表的兩個復份在許多方面近似,所以信度系數有稍稍偏高的傾向。
(4)被試易出現疲勞、失去積極性等反應,還會出現遷移(由于第二個測驗只改變了題目的具體內容,已經掌握的解題原則很容易遷移到同類問題)。這些稱為順序效應,為了抵消順序效應,可隨機分配一半被試先做復本A再做復本B,另一半被試先做復本B再做復本A,以平衡順序效應。
(5)復本法只能減少而不能完全排除練習和記憶的影響。
(6)對于許多測驗來說,建立復本是相當困難的。一般來說,成就測驗、特殊能力測驗容易建立復本,因為較容易出題,但對于一些不易測量的特質,如人格、動機等,則不易找到等值的測題,復本的編制較困難。
同再測信度一樣,在報告復本信度時,也應說明兩次測驗的時間間隔,以及在此間隔內被試的有關經歷。
三、等值穩定性系數
等值穩定性系數是用兩個平行的(等值的)測驗,間隔適當時距施測于同一組被試得到兩組測驗分數,求這兩組測驗分數的相關,其相關系數就是等值穩定性系數。
等值穩定性系數的模式是:測驗A 適當時距 測驗B
計算方法同穩定性系數和等值性系數。
等值穩定性系數也是采用復本對被試施測,但等值性系數的測驗要求兩次測驗的時間間隔盡可能短,而計算等值穩定性系數的兩次測驗卻要求有一個適當的時距。時距的規定可參照穩定性系數。
優點:(1)因兩次測試有適當的時間間隔,減少了復本法中的練習、疲勞效應。 (2)只要時間間隔適當,可用于計算穩定性不高的心理特質的測驗的信度。如,對學生所學知識的測驗,穩定性較差,遺忘或通過學習知識的增長。此時,可以盡量縮短時間間隔,減少這些不穩定的效應。
注意:
等值穩定性信度系數的值一般要比等值性系數和穩定性系數要低。因為,時間因素會引起我們所要測量的心理特質的變化以及測題的取樣不同會影響兩次測驗分數的一致性。因此,等值穩定性系數是測驗信度的最嚴格的考察,得到的是信度系數的下限。
四、內部一致性系數
前面所講的估計信度的方法,都必須對被試測驗兩次,然后計算兩次測驗得分的相關系數。但是,有的測驗沒有復份,如人格測驗,等值的測題很難編,編制復本很難。有的測驗在施行一次以后,由于被試流動或不易召集,再測一次比較困難。因此,我們還要設法利用一次測驗所獲得的資料來計算信度系數。這樣計算出來的信度系數反應的是測驗內部的一致性,即測驗項目的同質性,也就是測驗內部所以題目間的一致性,叫做內部一致性系數或同質性系數或同質性信度。
計算內部一致性系數的方法有兩種,下面逐一介紹。
(一)分半法(分半信度)
分半信度(Split-half reliability):分半信度就是將測驗題目分成等值的兩半,分半求出量表題目的總分,再計算兩部分總分的相關系數。
分半法實際上是一種特殊的復本法。可以把對等的兩半測驗看成是在最短的時間內施測的兩個平行的測驗。
分半的方法很多,常見的方法是把一個量表按題目番號分為兩半,一半是奇數題,另一半數偶數題。求出每個人的奇數題的總得分和偶數題的總得分,然后求出奇數題總得分和偶數題總得分的相關系數,最后對相關系數進行校正。為什么要進行校正呢?因為,分半以后,我們實際上計算的是測驗的一般題目的信度,而非整個測驗的信度,也就是說我們把一個完整的測驗分成了兩個等值的復本,所計算的只是其中一個復本的信度,這就會造成對整個測驗的信度的低估,因為信度會隨著測驗長度的增加而提高。所以,要對求出的相關系數進行校正。