Ocena ważności konstruktu wymaga, aby korelacje miary były badane w odniesieniu do zmiennych, o których wiadomo, że są związane z konstruktem (rzekomo mierzonym przez oceniany instrument lub dla których istnieją teoretyczne podstawy, aby oczekiwać, że są związane). Jest to zgodne z macierzą MTMM (multitrait-multimethod matrix) badania trafności konstruktu opisaną w przełomowej pracy Campbella i Fiske’a (1959). Istnieją inne metody oceny trafności konstruktu poza MTMM. Może być ona oceniana poprzez różne formy analizy czynnikowej, modelowanie równań strukturalnych (SEM) i inne oceny statystyczne. Ważne jest, aby zauważyć, że pojedyncze badanie nie dowodzi trafności konstruktu. Jest to raczej ciągły proces ewaluacji, reewaluacji, udoskonalania i rozwoju. Korelacje, które pasują do oczekiwanego wzorca, stanowią dowód ważności konstruktu. Trafność konstruktu jest oceną opartą na nagromadzeniu korelacji z licznych badań wykorzystujących ewaluowany instrument.
Większość badaczy próbuje przetestować trafność konstruktu przed rozpoczęciem głównych badań. W tym celu można wykorzystać badania pilotażowe. Badania pilotażowe to badania wstępne na małą skalę, których celem jest sprawdzenie wykonalności badania na pełną skalę. Badania pilotażowe określają siłę badań i pozwalają na dokonanie niezbędnych korekt. Inną metodą jest technika znanych grup, która polega na podawaniu instrumentu pomiarowego grupom, od których oczekuje się, że będą się różnić ze względu na znane cechy. Testowanie związków hipotetycznych polega na logicznej analizie opartej na teorii lub wcześniejszych badaniach. Badania interwencyjne są kolejną metodą oceny trafności konstruktu. Badania interwencyjne, w których grupa z niskimi wynikami w danym konstrukcie jest testowana, uczona konstruktu, a następnie ponownie mierzona, mogą zademonstrować ważność konstruktu testu. Jeśli istnieje znacząca różnica pomiędzy wynikami przed testem i po teście, które są analizowane przez testy statystyczne, może to świadczyć o dobrej trafności konstruktu.
Ważność zbieżna i dyskryminacyjnaEdit
Ważność zbieżna i dyskryminacyjna to dwa podtypy trafności, które składają się na trafność konstruktu. Trafność konwergencyjna odnosi się do stopnia, w jakim dwie miary konstruktów, które teoretycznie powinny być powiązane, są faktycznie powiązane. W przeciwieństwie do tego, trafność dyskryminacyjna sprawdza, czy koncepcje lub miary, które mają być niepowiązane, są w rzeczywistości niepowiązane. Weźmy, na przykład, konstrukt ogólnego szczęścia. Jeśli miara ogólnego szczęścia ma trafność zbieżną (convergent validity), to konstrukty podobne do szczęścia (zadowolenie, satysfakcja, wesołość, itp.) powinny pozytywnie odnosić się do miary ogólnego szczęścia. Jeśli miara ta ma trafność dyskryminacyjną (discriminant validity), to konstrukty, które nie powinny być pozytywnie związane z ogólnym szczęściem (smutek, depresja, rozpacz itp.) nie powinny wiązać się z miarą ogólnego szczęścia. Pomiary mogą mieć jeden z podtypów trafności konstruktu, a nie mieć drugiego. Używając przykładu ogólnego szczęścia, badacz może stworzyć inwentarz, w którym istnieje bardzo wysoka pozytywna korelacja między ogólnym szczęściem a zadowoleniem, ale jeśli istnieje również znacząca pozytywna korelacja między szczęściem a depresją, wtedy ważność konstruktu miary jest kwestionowana. Test ma trafność konwergencyjną, ale nie dyskryminacyjną.
Sieć nomologicznaEdit
Lee Cronbach i Paul Meehl (1955) zaproponowali, że rozwój sieci nomologicznej jest niezbędny do pomiaru trafności konstrukcyjnej testu. Sieć nomologiczna definiuje konstrukt poprzez zobrazowanie jego związku z innymi konstruktami i zachowaniami. Jest to reprezentacja pojęć (konstruktów) będących przedmiotem zainteresowania w badaniu, ich obserwowalnych przejawów i wzajemnych powiązań między nimi. Bada, czy związki pomiędzy podobnymi konstruktami są rozważane z relacjami pomiędzy obserwowanymi miarami konstruktów. Dokładna obserwacja relacji konstruktów względem siebie może wygenerować nowe konstrukty. Na przykład, inteligencja i pamięć robocza są uważane za wysoce powiązane konstrukty. Dzięki obserwacji ich podstawowych komponentów psychologowie stworzyli nowe konstrukty teoretyczne, takie jak: uwaga kontrolowana i obciążenie krótkotrwałe. Tworzenie siatki nomologicznej może również uczynić obserwację i pomiar istniejących konstruktów bardziej efektywnymi poprzez wskazywanie błędów. Naukowcy odkryli, że badanie zgrubień na ludzkiej czaszce (frenologia) nie jest wskaźnikiem inteligencji, ale objętość mózgu jest. Usuwając teorię frenologii z nomologicznej sieci inteligencji i dodając teorię ewolucji masy mózgu, konstrukty inteligencji stają się bardziej efektywne i potężniejsze. Splot wszystkich tych powiązanych ze sobą koncepcji i ich obserwowalnych cech tworzy „sieć”, która wspiera ich teoretyczną koncepcję. Na przykład, w sieci nomologicznej dla osiągnięć akademickich, oczekiwalibyśmy, że obserwowalne cechy osiągnięć akademickich (tj. GPA, wyniki SAT i ACT) odnoszą się do obserwowalnych cech pilności (godziny spędzone na nauce, uważność na zajęciach, szczegółowość notatek). Jeśli tak nie jest, to istnieje problem z pomiarem (osiągnięć akademickich lub pracowitości) lub z rzekomą teorią osiągnięć. Jeśli są one wskaźnikami siebie nawzajem, wówczas sieć nomologiczna, a zatem i skonstruowana teoria osiągnięć akademickich, jest wzmocniona. Chociaż sieć nomologiczna proponuje teorię, jak wzmacniać konstrukty, nie mówi nam, jak możemy ocenić ważność konstruktu w badaniu.
Multitrait-multimethod matrixEdit
Macierz multitrait-multimethod (MTMM) to podejście do badania trafności konstruktu opracowane przez Campbella i Fiske’a (1959). Model ten bada zbieżność (dowody na to, że różne metody pomiaru danego konstruktu dają podobne wyniki) i rozróżnialność (zdolność do odróżnienia konstruktu od innych powiązanych konstruktów). Mierzy on sześć cech: ocenę trafności zbieżnej, ocenę trafności dyskryminacyjnej (rozbieżnej), jednostki cecha-metoda, wiele cech-wiele metod, naprawdę różne metodologie oraz charakterystykę cech. Taka konstrukcja pozwala badaczom na testowanie pod kątem: „zbieżność pomiędzy różnymi miarami (…) tej samej 'rzeczy’ (…) oraz na rozbieżność pomiędzy miarami (…) pokrewnych, ale koncepcyjnie odrębnych 'rzeczy’.