Pålitelighet og konsistens i psykometri

Når vi kaller noen eller noe pålitelig, mener vi at de er konsistente og pålitelige. Pålitelighet er også en viktig komponent i en god psykologisk test. Tross alt ville en test ikke være veldig verdifull hvis den var inkonsekvent og ga forskjellige resultater hver gang. Hvordan definerer psykologer pålitelighet? Hvilken innflytelse har den på psykologisk testing?

Pålitelighet refererer til et måls konsistens. En test anses å være pålitelig hvis vi får det samme resultatet gjentatte ganger. For eksempel, hvis en test er designet for å måle en egenskap (for eksempel introversjon), skal resultatene være omtrent de samme hver gang testen administreres til et individ. Dessverre er det umulig å beregne påliteligheten nøyaktig, men det kan estimeres på en rekke forskjellige måter.

Test-på nytt pålitelighet

Test-på nytt pålitelighet er et mål på konsistensen av en psykologisk test eller vurdering. Denne typen pålitelighet brukes til å bestemme konsistensen av en test over tid. Test-retest-pålitelighet brukes best til ting som er stabile over tid, for eksempel intelligens.

Test-retest-påliteligheten måles ved å administrere en test to ganger på to forskjellige tidspunkter. Denne typen pålitelighet forutsetter at det ikke vil være noen endring i kvaliteten eller konstruksjonen som måles. I de fleste tilfeller vil påliteligheten være høyere når det har gått litt tid mellom testene.

Test-testmetoden er bare en av måtene som kan brukes til å bestemme påliteligheten til en måling. Andre teknikker som kan brukes inkluderer inter-rater pålitelighet, intern konsistens og parallellforms pålitelighet.

Det er viktig å merke seg at påliteligheten av testtest bare refererer til konsistensen av en test, ikke nødvendigvis gyldigheten av resultatene.

Inter-Rater Pålitelighet

Denne typen pålitelighet vurderes ved å ha to eller flere uavhengige dommere som scorer testen, og poengene blir deretter sammenlignet for å bestemme konsistensen av estimatene.

En måte å teste påliteligheten mellom rater på er å la hver rater tildele hvert testelement en poengsum. For eksempel kan hver vurderer score poeng på en skala fra 1 til 10. Deretter beregner du sammenhengen mellom de to klassifiseringene for å bestemme nivået på inter-raters pålitelighet.

Et annet middel for å teste påliteligheten mellom rater er å la ratere bestemme hvilken kategori hver observasjon faller inn i og deretter beregne prosentandelen av enighet mellom raterne. Så hvis raterne er enige 8 av 10 ganger, har testen en pålitelighetsgrad på 80%.

Parallel-Forms Pålitelighet

Parallellforms pålitelighet måles ved å sammenligne to forskjellige tester som ble opprettet med samme innhold. Dette oppnås ved å lage et stort utvalg av testartikler som måler samme kvalitet og deretter tilfeldig dele delene i to separate tester. De to testene skal deretter administreres til de samme fagene samtidig.

Intern pålitelighet

Denne formen for pålitelighet brukes til å bedømme konsistensen av resultatene på tvers av elementene på den samme testen. I hovedsak sammenligner du testelementer som måler den samme konstruksjonen for å bestemme testens interne konsistens.

Når du ser et spørsmål som virker veldig likt et annet testspørsmål, kan det indikere at de to spørsmålene brukes til å måle påliteligheten.

Fordi de to spørsmålene er like og designet for å måle det samme, bør testtakeren svare på begge spørsmålene likt, noe som vil indikere at testen har intern konsistens.

Påvirkende faktorer

Det er en rekke forskjellige faktorer som kan påvirke påliteligheten til et mål. Først og kanskje mest åpenbart er det viktig at tingen som måles er ganske stabil og konsistent. Hvis den målte variabelen er noe som endres regelmessig, vil ikke resultatene av testen være konsistente.

Aspekter av testsituasjonen kan også påvirke påliteligheten. For eksempel, hvis testen administreres i et rom som er ekstremt varmt, kan respondentene bli distrahert og ikke i stand til å fullføre testen etter beste evne. Dette kan ha innflytelse på tiltakets pålitelighet.

Andre ting som tretthet, stress, sykdom, motivasjon, dårlige instruksjoner og miljøforstyrrelser kan også skade påliteligheten.

Pålitelighet kontra gyldighet

Det er viktig å merke seg at bare fordi en test har pålitelighet, betyr det ikke at den har gyldighet. Gyldighet refererer til om en test virkelig måler det den hevder å måle.

Tenk på pålitelighet som et mål på presisjon og validitet som et mål på nøyaktighet. I noen tilfeller kan en test være pålitelig, men ikke gyldig.

Tenk deg for eksempel at jobbsøkere tar en test for å avgjøre om de har et bestemt personlighetstrekk. Selv om testen kan gi konsistente resultater, kan det hende at den faktisk ikke måler egenskapen den påstås å måle.