4 różnice między wiarygodnością i trafnością (w nauce)

Kwiecień 23, 2024

Ponieważ w języku potocznym mają bardzo podobne znaczenie, łatwo jest pomylić terminy wiarygodności i trafności, gdy mówimy o nauce, a konkretnie o psychometrii.

Za pomocą tego tekstu zamierzamy wyjaśnić główne różnice między niezawodnością i trafnością , Mamy nadzieję, że przydatne będzie wyjaśnienie tej zwykłej wątpliwości.

Powiązany artykuł: "Psychometria: badanie ludzkiego umysłu poprzez dane"

Czym jest niezawodność?

W psychometrii pojęcie "niezawodność" odnosi się do dokładności instrumentu ; W szczególności współczynniki niezawodności informują nas o spójności i stabilności działań podejmowanych za pomocą tego narzędzia.

Im większa niezawodność instrumentu, tym mniejsza ilość przypadkowych i nieprzewidywalnych błędów, które pojawią się podczas używania go do mierzenia pewnych atrybutów. Niezawodność wyklucza przewidywalne błędy, czyli te, które podlegają kontroli eksperymentalnej.

Zgodnie z klasyczną teorią testów, wiarygodność jest proporcją wariancji, którą wyjaśniają prawdziwe wyniki. Zatem bezpośredni wynik w teście składałby się z sumy błędu losowego i prawdziwego wyniku.

Dwa główne elementy niezawodności mają tymczasową stabilność i wewnętrzną spójność , Pierwsza koncepcja wskazuje, że wyniki zmieniają się nieznacznie, gdy mierzy się je przy różnych okazjach, podczas gdy wewnętrzna spójność odnosi się do stopnia, w jakim elementy, które składają się na test, mierzą ten sam konstrukt psychologiczny.

W związku z tym wysoki współczynnik niezawodności wskazuje, że wyniki w teście zmieniają się nieznacznie wewnętrznie oraz w funkcji czasu i, podsumowując, że przyrząd nie zawiera błędów pomiarowych .

Może jesteś zainteresowany: "Rodzaje testów psychologicznych: ich funkcje i cechy"

Definicja ważności

Kiedy mówimy o słuszności, odnosimy się do tego, czy test poprawnie mierzy konstrukcję, którą zamierza zmierzyć. Ta koncepcja jest zdefiniowana jako związek między wynikiem uzyskanym w teście a innym powiązanym środkiem ; stopień liniowej korelacji między obydwoma elementami określa współczynnik ważności.

Również w badaniach naukowych wysoka ważność wskazuje stopień, w jakim można uogólnić wyniki uzyskane przy danym przyrządzie lub w badaniu.

Istnieją różne rodzaje ważności, które zależą od sposobu, w jaki są obliczane; to czyni go terminem o bardzo różnych znaczeniach. Zasadniczo możemy rozróżnić ważność treści, kryterium (lub empiryczność) i trafność konstrukcji .

Ważność treści określa, w jakim stopniu elementy testu psychometrycznego są reprezentatywną próbką elementów, które składają się na konstrukt, który ma być oceniony. Instrument musi obejmować wszystkie podstawowe aspekty konstrukcji; Na przykład, jeśli chcemy wykonać odpowiedni test do pomiaru depresji, musimy koniecznie uwzględnić przedmioty, które oceniają nastrój i zmniejszają przyjemność.

Kryterium ważności mierzy zdolność instrumentu do przewidywania aspektów związanych z cechą lub obszarem zainteresowania. Wreszcie, trafność konstrukcji jest zamierzona określić, czy test mierzy to, co zamierza zmierzyć na przykład ze zbieżności z wynikami uzyskanymi w podobnych testach.

Różnice między niezawodnością i trafnością

Chociaż te dwie właściwości psychometryczne są ze sobą ściśle powiązane, prawdą jest, że odnoszą się one do wyraźnie zróżnicowanych aspektów. Zobaczmy, jakie są te różnice .

1. Przedmiot analizy

Niezawodność jest cechą instrumentu, w tym sensie, że mierzy właściwości przedmiotów, które go zawierają. Z drugiej strony, ważność nie odnosi się dokładnie do instrumentu, ale do uogólnień, które powstają z wyników uzyskane za jego pośrednictwem.

2. Informacje, które przekazują

Chociaż jest to dość uproszczony sposób, ogólnie rzecz biorąc, często mówi się, że słuszność wskazuje, że narzędzie psychometryczne faktycznie mierzy konstrukcję, którą zamierza zmierzyć, podczas gdy niezawodność odnosi się do tego, czy poprawnie ją mierzy, bez błędów.

3. Sposób, w jaki są obliczane

Zasadniczo stosuje się trzy procedury pomiaru niezawodności: metoda dwóch połówek, jedna z form równoległych i test-powtórzenie , Najczęściej stosowana jest procedura z dwóch połówek, w której przedmioty są podzielone na dwie grupy po udzieleniu odpowiedzi; następnie analizowana jest korelacja między dwiema połowami.

Metoda równoległych lub alternatywnych formularzy polega na stworzeniu dwóch równoważnych testów do pomiaru w jakim stopniu korelują elementy między nimi. Ponowne testowanie polega po prostu na dwukrotnym zaliczeniu testu w warunkach jak najbardziej zbliżonych.Obie procedury można łączyć, powodując ponowne testowanie z równoległymi formularzami, co polega na pozostawieniu odstępu czasowego między pierwszą formą testu a drugą.

Ze swojej strony ważność jest obliczany na różne sposoby w zależności od typu , ale ogólnie wszystkie metody opierają się na porównaniu wyniku w teście obiektywnym i innych danych tych samych podmiotów w odniesieniu do podobnych cech; celem jest to, że test może działać jako predykator tej cechy.

Wśród metod stosowanych do oceny trafności znajdujemy analizę czynnikową i technikę wielo-metodowo-wielo-cechowych macierzy. Ważność treści często zależy również od racjonalnych, niestatystycznych analiz; na przykład obejmuje pozorną ważność, która odnosi się do subiektywnego osądu ekspertów w sprawie ważności testu.

4. Związek między obiema koncepcjami

Wiarygodność instrumentu psychometrycznego wpływa na jego ważność: im bardziej jest wiarygodny, tym większa jest jego ważność , Dlatego współczynniki ważności narzędzia są zawsze niższe niż wiarygodności, a ważność pośrednio informuje nas o rzetelności.