心理測量的原理
第一節(jié) 心理測量的原理
測量是按照某種規(guī)律,用數(shù)據(jù)來描述觀察到的現(xiàn)象,即對事物做出量化描述。測量是對非量化事物的量化過程。
一、心理測量的基本原理
心理測量具有客觀性。人的心理過程是在大腦中進(jìn)行的,智力、人格、興趣、情緒、自我等都是難以用形象直觀呈現(xiàn)的心理活動,以今日的科學(xué)發(fā)展水平,人們還不能對心理現(xiàn)象進(jìn)行直接的測量。然而,根據(jù)心理學(xué)的特質(zhì)(trait)理論,某種內(nèi)在的不可直接測量的心理特質(zhì),可以表現(xiàn)為一系列具有內(nèi)在聯(lián)系的外顯行為,每個(gè)人的心理活動和特質(zhì)必定會反映在行為中。心理決定行為。有什么樣的心理特質(zhì),就會有什么樣的行為表現(xiàn)。比如,性格外向的人在大多數(shù)場合都會表現(xiàn)出善于交往,很容易交朋友,不懼生人和陌生環(huán)境,做事比較沖動,喜動不喜靜,喜歡與其他人一起工作,不喜歡單獨(dú)工作,喜歡與人打交道。因此,心理學(xué)家可以根據(jù)對外顯行為的評定間接地測量人的心理特質(zhì)。心理測量的基本原理是,測量被測試者對測驗(yàn)項(xiàng)目所表現(xiàn)的行為反應(yīng),將測量結(jié)果與一般人在同樣情境下的行為反應(yīng)進(jìn)行比較和分析,從而推測被測試者的心理特質(zhì)。
心理測量具有間接性。心理測量是一種間接測量,所以有精確的測量工具還不夠,還要有規(guī)范的測量程序和施測條件,否則測量結(jié)果就會受到各種因素的影響而產(chǎn)生嚴(yán)重誤差。
心理測量是通過對人的行為進(jìn)行比較來實(shí)現(xiàn)的。因此,心理測量沒有絕對的標(biāo)準(zhǔn),也就是說沒有絕對的零點(diǎn)。所謂心理測量,就是分析一個(gè)人處于人群行為的什么位置上。由于人群的行為是經(jīng)常變化的,一個(gè)人的行為在人群平均行為的位置也是變化的。所以,心理測量的結(jié)果具有相對性。比如,智力測驗(yàn)所測得的一個(gè)人智力的高低,是與他所在人群總體的行為表現(xiàn)或某種人為的標(biāo)準(zhǔn)相比較而言的,而且智力標(biāo)準(zhǔn)也不是一成不變的。
圖7-1 知覺測驗(yàn)圖片材料
由于心理測量的間接性和相對性,所以心理測量可信,但不能全信;有用,但不能完全依靠它。心理測量要在專業(yè)人員的指導(dǎo)下正確使用測驗(yàn)材料,不要濫用心理測驗(yàn),以免產(chǎn)生不良后果。
二、心理測量的基本概念
(一)項(xiàng)目分析
1.項(xiàng)目的難度
難度是指項(xiàng)目的難易程度。在能力測驗(yàn)中通常需要一個(gè)反映難度水平的指標(biāo),在非能力測驗(yàn)(如人格測驗(yàn))中,類似的指標(biāo)是“通俗性”,即取自相同總體的樣本中能夠回答該題的人數(shù),其計(jì)算方法與難度相同。
難度的指標(biāo)通常以通過率表示,即答對或通過該題的人數(shù)百分比,公式如下:
式中:P代表項(xiàng)目的難度,N為全體被試者人數(shù),R為答對或通過該項(xiàng)目的人數(shù)。
以通過率表示難度時(shí),通過人數(shù)越多(即P值越大),難度越低;P值越小,難度越高。因?yàn)镻值大小與難度高低成反比,所以也有人將其稱作易度。還有人將被試未通過每個(gè)項(xiàng)目的人數(shù)百分比作為難度的指標(biāo)。
進(jìn)行難度分析的主要目的是為了篩選項(xiàng)目,項(xiàng)目的難度多高合適,取決于測驗(yàn)的目的、性質(zhì)以及項(xiàng)目的形式。大多數(shù)心理測驗(yàn),都希望能準(zhǔn)確測量個(gè)體的差異。如果在某題上,被試全部答對或答錯(cuò),則該題無法提供個(gè)別差異的信息,也不會影響測驗(yàn)分?jǐn)?shù)的分布,該題對測驗(yàn)沒有作用。因此,為了使測驗(yàn)具有較大的區(qū)別力,應(yīng)選擇平均難度在0. 50左右的試題比較合適,也就是測試題的難度應(yīng)當(dāng)在0. 50±0. 20之間。
2.項(xiàng)目的區(qū)分度
項(xiàng)目的區(qū)分度也叫鑒別力,是指測驗(yàn)項(xiàng)目對被測驗(yàn)者的心理特性的區(qū)分能力。如果一個(gè)項(xiàng)目,水平高的被試能順利通過,水平低的被試不能通過,那么就可以認(rèn)為該項(xiàng)目有較高的區(qū)分度。
在理論上,項(xiàng)目區(qū)分度是以項(xiàng)目得分高低與實(shí)際能力水平高低之間的相關(guān)來表示的。但是,被試的實(shí)際能力水平很難直接測量。所以,在具體估計(jì)項(xiàng)目區(qū)分度時(shí),常使用“鑒別指數(shù)”來替代,公式如下:
D=PH-PL
式中:D為鑒別指數(shù),PH為高分組的被測驗(yàn)者在該項(xiàng)目上的通過率或得分率,PL為低分組的被測驗(yàn)者在該項(xiàng)目上的通過率或得分率。
表7-1 項(xiàng)目鑒別指數(shù)與評價(jià)標(biāo)準(zhǔn)(1)
以上公式以高分組與低分組的得分率的差為鑒別指數(shù)的指標(biāo),其理由是高分組若在該測驗(yàn)上的得分率高于低分組,則D>0,D越大,說明該項(xiàng)目區(qū)分兩種不同水平的程度越高。若D<0,則反映高水平組在該項(xiàng)目上的得分率反而低于低水平組,說明項(xiàng)目有問題。因此,D可以反映項(xiàng)目得分與測驗(yàn)總分之間的關(guān)系,將它作為區(qū)分度的指標(biāo)是合理的。項(xiàng)目鑒別指數(shù)與評價(jià)標(biāo)準(zhǔn)見表7-1所示。
項(xiàng)目區(qū)分度是評價(jià)項(xiàng)目質(zhì)量和篩選項(xiàng)目的主要指標(biāo)。通常區(qū)分度取值范圍介于-1至+1之間。假如項(xiàng)目得分與實(shí)際能力水平之間呈負(fù)相關(guān),則區(qū)分度為負(fù)值;若呈正相關(guān),則區(qū)分度為正值;相關(guān)系數(shù)越大,區(qū)分度越高。當(dāng)區(qū)分度為負(fù)值時(shí),意味著被試實(shí)際能力越高,該項(xiàng)目的得分反而越低,這種情況一般很少發(fā)生,如果出現(xiàn),該項(xiàng)目應(yīng)該淘汰。
表7-2 D的最大值與項(xiàng)目難度的關(guān)系
3.項(xiàng)目區(qū)分度與難度的關(guān)系
區(qū)分度與難度之間有密切的關(guān)系。以鑒別指數(shù)(D)為例,假如樣本中通過某一項(xiàng)目的人數(shù)比率為1. 00或0,則說明高分組與低分組在通過率上不存在差異,因此D為0;假如項(xiàng)目的通過率為0. 50,則可能是高分組的所有人都通過了,而低分組卻無人通過,這樣D的最大值可能達(dá)到1. 00。用同樣方法可指出不同難度項(xiàng)目可能的最大D值。D的最大值與項(xiàng)目難度的關(guān)系如表7-2所示。
然而,難度和區(qū)分度都是相對的,絕對的難度和區(qū)分度是不存在的。一般來說,較難的項(xiàng)目對高水平的被試區(qū)分度高,較易的項(xiàng)目對水平低的被試區(qū)分度高,中等難度的項(xiàng)目對中等水平的被試區(qū)分度高。
不過,由于人群的大多數(shù)心理特性呈常態(tài)分布,所以項(xiàng)目難度的分布也以常態(tài)分布為好,即特別難與特別容易的項(xiàng)目少些,接近中等難度的項(xiàng)目多些,而所有項(xiàng)目的平均難度為0. 50。這樣不僅能保證多數(shù)項(xiàng)目具有較高的區(qū)分度,而且可以保證整個(gè)測驗(yàn)對大多數(shù)被試具有較高的區(qū)分能力。
(二)信度和效度
1.信度
心理測量中所說的信度,是指測量結(jié)果的可靠性或一致性。信度概念中比較常用的是重測信度。重測信度是指用同一測驗(yàn),在不同時(shí)間對同一群體施測兩次,這兩次測驗(yàn)分?jǐn)?shù)的一致性(通常用相關(guān)系數(shù)來表示)。重測信度是衡量一個(gè)測驗(yàn)的結(jié)果是否可靠的標(biāo)準(zhǔn)之一。比如,我們用A測驗(yàn)測查某一被試的智商,第一次結(jié)果智商是100。一個(gè)星期以后,我們用同樣的測驗(yàn)對他進(jìn)行第二次測驗(yàn),結(jié)果發(fā)現(xiàn)他的智商變成了140。若沒有特殊的原因,一個(gè)人的智商是不可能在一周之內(nèi)發(fā)生如此大的變化的。所以,在一般情況下,我們會認(rèn)為這個(gè)測驗(yàn)的重測信度很低,測驗(yàn)結(jié)果是不可信的。
信度是衡量任何測驗(yàn)質(zhì)量的基本指標(biāo),一個(gè)測驗(yàn)的信度較高,則說明它的分?jǐn)?shù)是穩(wěn)定的、一致的,它的測量結(jié)果是可靠的。信度的數(shù)值在0~1之間,數(shù)值越高,信度越高。一般來說,當(dāng)信度大于0. 7時(shí),可以將測驗(yàn)結(jié)果進(jìn)行不同團(tuán)體間的比較;當(dāng)信度大于0. 85時(shí),測驗(yàn)結(jié)果才能應(yīng)用于個(gè)人之間的比較和評價(jià)。
信度只受隨機(jī)誤差的影響。隨機(jī)誤差是指與測量目的無關(guān)的因素,其存在會影響測量結(jié)果的可靠性和準(zhǔn)確性。隨機(jī)誤差越大,信度越低。因此,信度也可看作測驗(yàn)結(jié)果受機(jī)遇影響的程度。而系統(tǒng)誤差產(chǎn)生恒定效應(yīng),不影響信度。
每一個(gè)測驗(yàn)的實(shí)得分?jǐn)?shù)(X)總是由真實(shí)分?jǐn)?shù)(T)和誤差(E)兩部分構(gòu)成,用公式表示如下:
X=T+E
當(dāng)討論一組測驗(yàn)分?jǐn)?shù)的特性時(shí),可用方差代表具體分?jǐn)?shù):
式中:
在測量理論中,信度被定義為:一組測驗(yàn)真實(shí)分?jǐn)?shù)方差與總方差(實(shí)得分?jǐn)?shù)的方差)的比率,即由于真實(shí)分?jǐn)?shù)的方差是無法統(tǒng)計(jì)的,因此計(jì)算信度的公式可轉(zhuǎn)化為:
因此,信度也可以看作在總的方差中非測量誤差的方差所占的比例。以圖示方法可以更清楚地理解信度(圖7-2)。
圖7-2
及信度的關(guān)系
2.效度
一個(gè)測驗(yàn)光有信度還不夠,測驗(yàn)分?jǐn)?shù)是穩(wěn)定的,并不能說明它就能夠準(zhǔn)確地測量想要測量的特質(zhì)。比如一臺磅秤,長期使用,彈簧早已疲勞,一個(gè)100斤的人站上去,顯示的卻是110斤,一天稱10次,顯示的都是110斤,“信度”足夠好,但測得的結(jié)果卻一點(diǎn)都不準(zhǔn)。由此,效度的概念應(yīng)運(yùn)而生。通俗地說,測量的效度就是指測量的有效性。一個(gè)測驗(yàn)的效度越高,表明它所測得的結(jié)果越能代表所要測量特質(zhì)的真正水平。
在心理測驗(yàn)中,效度是指所測量結(jié)果與所要測量的心理特點(diǎn)符合的程度,簡單地說,就是心理測驗(yàn)的準(zhǔn)確性。因此,心理測驗(yàn)無論是選用標(biāo)準(zhǔn)化測驗(yàn)或自行設(shè)計(jì)編制測量工具,必須首先鑒定其效度,沒有效度資料的測驗(yàn)是不能使用的。
效度的定義也可以通過真分?jǐn)?shù)的概念和方差分析方法加以說明。一組測驗(yàn)分?jǐn)?shù)的總方差等于真實(shí)方差與誤差方差之和,而真實(shí)方差又可分為兩部分,即有關(guān)的方差和無關(guān)但穩(wěn)定的方差,后者也就是所謂系統(tǒng)誤差帶來的方差,可用公式表示為:
在測驗(yàn)理論中,效度被定義為在一組測量中,與測量目標(biāo)有關(guān)的真實(shí)方差(或有效方差)與總方差的比率,即:
分析一個(gè)測驗(yàn)是否有效度通??梢詮娜齻€(gè)方面來加以判斷:一是效標(biāo)效度。所謂效標(biāo)是指那種已知能表現(xiàn)某種心理特征的標(biāo)準(zhǔn)。效標(biāo)效度就是求取測驗(yàn)結(jié)果與效標(biāo)之間的相關(guān),比如在職業(yè)崗位中的實(shí)際工作成效可以作為一個(gè)職業(yè)選拔測驗(yàn)的效標(biāo),如果兩者的相關(guān)高就說明職業(yè)選拔測驗(yàn)有很高的效度,這樣測驗(yàn)的結(jié)果以后還能夠預(yù)測在職業(yè)中的成就,所以效標(biāo)效度也是一種預(yù)測性的指標(biāo)。二是內(nèi)容效度,也就是從內(nèi)容上來分析測驗(yàn)?zāi)芊駵y量要測量的特征。智力測驗(yàn)需要能測量智力的題目,人格測驗(yàn)也需要能測量人格特征的題目,由此可從內(nèi)容上去判斷這個(gè)測驗(yàn)是否有效。對內(nèi)容的判斷可以讓專家來進(jìn)行,也可通過一些統(tǒng)計(jì)方法來確認(rèn)。三是結(jié)構(gòu)效度。在心理測量中每一種測驗(yàn)的編制都需要依據(jù)理論,結(jié)構(gòu)效度就是分析測量結(jié)果與理論中重要思想或觀點(diǎn)是否一致。(2)
3.信度和效度的關(guān)系
根據(jù)定義,可以知道信度和效度的差別在于所涉及的誤差不同。信度考慮的是隨機(jī)誤差的影響,而效度還包括與測驗(yàn)無關(guān)但穩(wěn)定的測量誤差。信度不考慮與目的有關(guān)還是無關(guān),只要是穩(wěn)定的其信度就高,但效度還要考慮這一問題,所以如果與測量目的無關(guān),那么哪怕它再穩(wěn)定也不會使測驗(yàn)的效度提高。
由此可以看出效度與信度既有關(guān)又有不同:信度是效度的一個(gè)必要條件,一個(gè)測驗(yàn)的信度不高,效度也難以達(dá)到很高的程度,因?yàn)樾哦鹊鸵簿褪钦鎸?shí)分?jǐn)?shù)在測驗(yàn)分?jǐn)?shù)中的比率小,而這也同樣會影響效度。但是,如果一個(gè)測驗(yàn)的信度高其效度卻未必高,因?yàn)槿绻鎸?shí)分?jǐn)?shù)中與測量目的無關(guān)的部分占很大比率,那么信度再高也不會使效度提高。所以,信度不是效度的充分條件,但信度是效度的必要條件。也就是說,可信的測驗(yàn)未必有效,但有效的測驗(yàn)必定可信。總之,信度是效度的必要而非充分條件,而效度受到信度的制約。
(三)測驗(yàn)的標(biāo)準(zhǔn)化和常模
1.測驗(yàn)的標(biāo)準(zhǔn)化
一個(gè)人在心理測驗(yàn)中的表現(xiàn),不僅決定于自身的素質(zhì),有時(shí)還會受到許多與測驗(yàn)無關(guān)的因素的影響,比如考場環(huán)境、主考官的指導(dǎo)語、評分者的水平等。為了使測驗(yàn)的結(jié)果更加準(zhǔn)確、可靠,減少誤差,我們就要在測驗(yàn)實(shí)施過程中盡量控制無關(guān)因素對測驗(yàn)的影響,使測驗(yàn)分?jǐn)?shù)能夠真正反映一個(gè)人真實(shí)的心理水平。這個(gè)控制測驗(yàn)的過程,稱作測驗(yàn)的標(biāo)準(zhǔn)化。測驗(yàn)的標(biāo)準(zhǔn)化包括以下幾個(gè)方面:
(1)內(nèi)容標(biāo)準(zhǔn)化,即對所有被試施測相同的內(nèi)容。測驗(yàn)的內(nèi)容不同,所得的測驗(yàn)分?jǐn)?shù)是無法相互比較的。
(2)施測過程標(biāo)準(zhǔn)化。首先,無論在何時(shí)何地給何人施測,主持測驗(yàn)者宣讀的測驗(yàn)指導(dǎo)語必須完全一致。第二,測驗(yàn)的時(shí)間長短要統(tǒng)一,這一點(diǎn)對能力測驗(yàn)尤為重要。
(3)評分標(biāo)準(zhǔn)化,即客觀評分。對于那些需要主觀評分的測驗(yàn),要求至少有兩個(gè)以上受過專業(yè)訓(xùn)練的評分者同時(shí)評分,而且他們的分?jǐn)?shù)必須具有一致性。
2.常模
一個(gè)標(biāo)準(zhǔn)化的測驗(yàn),不但內(nèi)容、施測和評分要標(biāo)準(zhǔn)化,對分?jǐn)?shù)的解釋也必須標(biāo)準(zhǔn)化。在心理測驗(yàn)中,把一個(gè)人所得的分?jǐn)?shù)與一般人同類行為的分?jǐn)?shù)分布情況相比較,可以判別其所得分?jǐn)?shù)的高低。這里的“一般人同類行為的分?jǐn)?shù)分布情況”,就是心理測驗(yàn)的“常?!?。
建立常模的方法是,在將來要進(jìn)行心理測驗(yàn)的對象中,選擇有代表性的一部分人(稱為標(biāo)準(zhǔn)化樣本),對這些人進(jìn)行測驗(yàn),并將所得的分?jǐn)?shù)加以統(tǒng)計(jì)整理,得出一個(gè)具有代表性的分?jǐn)?shù)分布,這個(gè)分布就被稱為常模。常??梢蜻M(jìn)行標(biāo)準(zhǔn)化處理時(shí)選取樣本的不同而有不同的類別,形成不同的亞常模。常見的亞常模有年齡常模、年級常模、性別常模、地域常模、民族常模、職業(yè)常模等。
常模團(tuán)體是具有某種共同特征的人所組成的一個(gè)群體,或者是該群體的一個(gè)樣本。它用一個(gè)標(biāo)準(zhǔn)、規(guī)范的分?jǐn)?shù)表示出來,以提供比較的基礎(chǔ)。任何一個(gè)測驗(yàn)都有許多可能的常模團(tuán)體。由于個(gè)人的相對等級隨著比較的常模團(tuán)體的不同而有很大的變化,所以在制定常模時(shí),首先要確定常模團(tuán)體,在對常模參考分?jǐn)?shù)作解釋時(shí),也必須考慮常模團(tuán)體的組成。
常模團(tuán)體的確定離不開取樣,也就是從目標(biāo)人群中選擇有代表性的樣本。從統(tǒng)計(jì)學(xué)角度看,取樣的方法有隨機(jī)抽樣和非隨機(jī)抽樣兩種。前者根據(jù)隨機(jī)原則進(jìn)行,而后者則沒有隨機(jī)性。
常模有一般常模與特殊常模兩種類型。測驗(yàn)手冊上所列的常模通常為一般常模,不一定適合使用者的具體情況。特殊常模是為非典型團(tuán)體建立的,一般比為小團(tuán)體建立的常模范圍更窄。其優(yōu)點(diǎn)是,可使被試的結(jié)果與最接近的人進(jìn)行比較;但這同時(shí)也是它的缺點(diǎn),不容許分?jǐn)?shù)在較廣的范圍內(nèi)作解釋。不過,測驗(yàn)使用者可將特殊常模與一般常模結(jié)合起來,從而獲得更廣泛的信息,效果也更佳。(3)
免責(zé)聲明:以上內(nèi)容源自網(wǎng)絡(luò),版權(quán)歸原作者所有,如有侵犯您的原創(chuàng)版權(quán)請告知,我們將盡快刪除相關(guān)內(nèi)容。