NOTATKi (ROŻNE)

159

Wracając do przykładu metodologicznej gry towarzyskiej, moglibyśmy poprosić zgro¬madzenie ludzi, ażeby pogrupowali się wedle wieku. Wszystkie jednolatki stałyby więc (ewentualnie siedziały lub leżały) razem, podobnie dwulatki, trzylatki itd. Fakt, że członkowie każdej z grup są w tym samym wieku oraz że każda grupa osób reprezentuje inny wek. wystarcza dla spełnienia minimalnych wymagań stawianych zmiennym nominalnym, Uporządkowanie grup w szeregu od najmłod¬szej do najstarszej spełnia wymogi przewidziane dla zmiennych porządkowych i pozwala TSITI określić, czy dana osoba jest w tym samym wieku co inna, starsza od niej, czy też młodsza. Jeśli rozmieścimy grupy w równych odległościach, spełnimy dodatkowo warunek nałożony na zmienną interwałową, dzięki czemu będziemy w stanie powiedzieć, o ile lat jedna osoba jest starsza od drugiej. Wreszcie, znieważ jedna z wartości zmiennej wiek odpowiada prawdziwemu zeru (dzieci noszone przez kobiety w ciąży tuż przed porodem), na¬sza grupa nieszczęsnych uczestników imprezy spełnia też wymogi pomiaru ilorazowego, co rozwala nam stwierdzić na przykład, że jedna osoba jest dwa razy starsza od drugiej. Innym przykładem miernika ilorazowego jest dochód, który obejmuje zakres od absolutnego zera właściwie do nieskończoności, jeśli przypad¬kiem jesteś założycielem firmy Microsoft.
Porównanie dwóch osób w kategoriach zmiennej ilorazowej pozwala nam więc stwier¬dzić, że (1) różnią się one lub są takie same, (2) jedna jest „bardziej" niż druga, (3) na ile się różnią i (4) jaki jest stosunek ilościowy jednej do drugiej (iloraz). Rysunek 5.1 przedstawia podsu¬mowanie tej części rozważań w formie ilustracji graficznej czterech poziomów pomiaru.

Implikacje poziomów pomiaru

Jako że małe jest prawdopodobieństwo, by udało ci się dokonać dopiero co opisanych fi¬zycznych przegrupowań ludzi (spróbuj tylko, jeśli nie chcesz być niepokojony zbyt licznymi zaproszeniami na imprezy), chciałbym zwrócić twoją uwagę na pewne praktyczne implikacje
wprowadzonych powyżej rozróżnień. Impli¬kacje te przejawiają się przede wszystkim w analizie danych (omówionej w części 4), mu¬sisz jednak przewidywać je już na etapie two¬rzenia struktury projektu badawczego.
Pewne techniki analizy ilościowej wymagają użycia zmiennych, które mają określony mini¬malny poziom pomiaru. Powinieneś zaplanować swoje techniki analityczne stosownie do pozio¬mu pomiaru, do którego ograniczone są zmien¬ne przeznaczone do analizy w projekcie badaw¬czym, na przykład poziomu porządkowego. Dokładniej mówiąc, powinieneś przewidywać, jakie wnioski badawcze możesz wyciągnąć, dys¬ponując zmiennymi o określonym poziomie po¬miaru. Mógłbyś na przykład postanowić zbadać i opisać średni wiek badanej populacji (dodając wiek poszczególnych jednostek i dzieląc sumę przez ich liczbę), nie powinieneś jednak plano¬wać badania średniej przynależności religijnej, ponieważ jest to zmienna nominalna, średnia zaś wymaga danych na poziomie ilorazowym. (Mógłbyś jednak podać modalną - najczęstszą przynależność religijną).
Możesz przy tym traktować niektóre zmienne jako odpowiedniki różnych poziomów pomiaru. Mierniki ilorazowe to poziom naj¬wyższy, z którego schodzimy, poprzez mierniki interwałowe i porządkowe, aż do najniższego poziomu pomiaru, czyli mierników nominal¬nych. Zmienną odpowiadającą wyższemu po¬ziomowi pomiaru - powiedzmy, ilorazową -możemy traktować także jako zmienną na niższym poziomie pomiaru - na przykład jako zmienną porządkową. Przypomnij sobie na przykład wiek, który jest zmienną ilorazową. Gdyby interesowała cię jedynie relacja między wiekiem a jakąś zmienną na poziomie porząd¬kowym - na przykład deklarowaną religijnoś¬cią: duża, średnia i mała - mógłbyś zdecydo¬wać, że także wiek będziesz traktował jako zmienną porządkową. Mógłbyś opisywać bada¬nych jako młodych, w średnim wieku i starych, precyzując, jaki zakres wieku należy do danej kategorii. Mógłbyś wreszcie, dla pewnych ce¬lów badawczych, używać wieku jako zmiennej nominalnej. Mógłbyś podzielić ludzi na urodzo¬nych w czasie kryzysu lat 30. lub kiedy indziej. Innym pomiarem nominalnym, opartym nie tyle

160

na wieku, co na dacie urodzenia, mógłby być pomiar ludzi podzielonych na grupy według znaków zodiaku.

Poszukiwany poziom pomiaru zależy zatem od planowanych sposobów analitycznego wy¬korzystania danej zmiennej, z uwzględnieniem faktu, że pewne zmienne są nierozerwalnie związane z pewnymi poziomami pomiaru. Jeśli zmienna ma być używana na wiele sposobów, wymagających różnych poziomów pomiaru, badanie powinno być zaprojektowane tak, by pozwoliło na osiągniecie najwyższego wyma¬ganego poziomu. Jeśli na przykład zapytasz ba¬danych o ich dokładny wiek, możesz ich potem ułożyć w podgrupy nominalne lub porządkowe.

Nie musisz jednak koniecznie mierzyć zmiennych na najwyższym poziomie pomiaru. Jeśli jesteś pewny, że nie są ci potrzebne dane o wieku badanych na poziomie pomiaru wyższym niż porządkowy, możesz ich po prostu poprosić, by wskazali, w którym przedziale wie¬kowym się mieszczą, na przykład od 20 do 29, od 30 do 39 itd. W badaniach stanu posiadania przedsiębiorstw nie musisz gromadzić szcze¬gółowych informacji - wystarczy, że posłużysz się skalą porządkową Dun & Bradstreet. Jeśli jednak twoje cele badawcze nie są do końca sprecyzowane, staraj się dotrzeć do najwyższe¬go możliwego poziomu pomiaru. Choć można zredukować pomiar ilorazowy do poziomu porządkowego, nie można przekształcić pomia¬ru porządkowego na ilorazowy. Ogólnie rzecz biorąc, nie można przekształcić zmiennej na niższym poziomie pomiaru w zmienną na po¬ziomie wyższym. Warto dobrze zapamiętać tę jednokierunkową drogę.

Wskaźniki proste i złożone

Mając do dyspozycji tak wiele możliwości operacjonalizacji zmiennych w naukach społecz¬nych, możesz zacząć się poważnie martwić, czy dokonasz właściwego wyboru. Pozwól, że postaram się rozjaśnić twoje myśli, dodając do poprzednich wywodów odrobinę poczucia pewności i stałości.

Wiele zmiennych w naukach społecznych ma w miarę proste, oczywiste wskaźniki. Jakby
na to nie patrzeć, płeć okazuje się na ogół kwestią bycia mężczyzną lub kobietą: zmienna na poziomie nominalnym, którą można mierzyć jedną obserwacją - wzrokową (no, może nie zawsze) lub odpowiedzią na pytanie (na ogół). W badaniu dzietności małżeństw mógłbyś co prawda wziąć pod uwagę dzieci adoptowane i przyjęte do rodzin zastępczych oraz dzieci z poprzedniego małżeństwa jednego lub oboj¬ga partnerów, zazwyczaj jednak stosunkowo łatwo jest się dowiedzieć, ile dzieci ma dana para. W przypadku większości badań liczba mieszkańców danego kraju jest liczbą miesz¬kańców tego kraju - sprawdzasz to w roczniku statystycznym i znasz odpowiedź. Tak więc wiele zmiennych ma oczywiste proste wskaźni¬ki. Docierając do pojedynczej informacji, wiesz wszystko, co jest ci potrzebne.
Niekiedy jednak zdarza się, że nie istnieje jeden wskaźnik, który da ci pomiar potrzebnej zmiennej. Jak już pisałem wcześniej w tym roz¬dziale, wiele pojęć podlega różnorodnym inter¬pretacjom, z których każda ma kilka możliwych wskaźników. W tego typu przypadkach mógłbyś dokonać kilku obserwacji danej zmiennej, na¬stępnie zaś połączyć zebrane informacje w celu stworzenia złożonego miernika badanej zmien¬nej. Rozdział 6 poświęcony jest metodom prze¬prowadzenia tej procedury, w tym miejscu roz¬ważymy więc jedynie krótki przykład.
Weźmy pojęcie „wyników w nauce". Wszyscy zauważyliśmy, że niektórzy studenci mają dobre, inni zaś słabe wyniki w nauce. Ba¬dając te różnice, moglibyśmy zadać sobie pyta¬nie, jakie cechy i doświadczenia są powiązane z osiąganiem dobrych wyników w nauce (wie¬lu badaczy tak właśnie zrobiło). Jak można zmierzyć ogólne wyniki w nauce? Każda ocena z każdego egzaminu jest potencjalnym wskaź¬nikiem wyników w nauce, może jednak nie być typowa dla ogólnych wyników danego studen¬ta. Rozwiązanie tego problemu ustaliło się już na tyle, że uważane jest za oczywiste: średnia punktów (grade point average - GPA). Przypisu¬jemy każdej ocenie określoną liczbę punktów, dodajemy punkty uzyskane przez danego stu¬denta i dzielimy je przez liczbę zdanych egza¬minów, otrzymując w ten sposób miernik zło¬żony. (Jeśli egzaminom przypisane są różne

161

wartości punktowe, obniżamy lub podwyż¬szamy odpowiednią wartość punktową). Tworzenie tego typu mierników złożonych jest :2ęsto bardzo przydatne w badaniach społecznych.

Kilka przykładów możliwych wyborów w procesie operacjonalizacji

Aby podsumować wszystkie możliwości operacjonalizacji dostępne badaczowi społecznemu, wskazując zarazem potencjał tkwiący w każdej : nich, rozważmy kilka alternatywnych podejść co rozmaitych problemów badawczych. Różne sposoby operacjonalizacji zmiennych w każdym przypadku mają ilustrować, jak wielkie pole do popisu dla naszej wyobraźni i kreatywności stwarzają badania społeczne. Dla uproszczenia -.ie usiłowałem nawet opisywać wszystkich warunków, które mogłyby przemawiać za jedną lub drugą możliwością, aczkolwiek w danych okolicznościach nie wszystkie one byłyby tak samo godne polecenia.
Oto konkretne problemy badawcze i kilka sposobów ich rozwiązania. Zacznijmy od przykładu omawianego już wcześniej w tym rozdziale -jego zaletą jest fakt, że operacjonalizacja jednej ze zmiennych jest bardzo prosta.

1. Czy kobiety są bardziej skłonne do współ¬czucia niż mężczyźni?

a. Wybierz grupę badanych, złożoną z ta¬kiej samej liczby mężczyzn i kobiet. Przedstaw im hipotetyczne sytuacje, w których ktoś jest w tarapatach. Zapy¬taj, co by zrobili, gdyby natknęli się na taką sytuację - na przykład małe dziec¬ko płaczące i zagubione w poszukiwa¬niu rodziców. Każdą odpowiedź, która wskazuje na chęć pocieszenia lub po¬mocy dziecku, uznaj za wskaźnik współczucia. Sprawdź, czy kobiety, czy też mężczyźni częściej
wskazują, że by¬liby skłonni do współczucia.

b. Zaprojektuj eksperyment, w którym pła¬cisz małemu dziecku za to, by udawało, że się zgubiło. Postaw dziecko na ruchli¬wym chodniku i obserwuj, czy częściej
oferują mu pomoc kobiety, czy mężczyź¬ni. Upewnij się, że policzyłeś ogólną licz¬bę przechodniów obu płci, ponieważ jedna z nich mogła być tam liczniej re¬prezentowana. W takim przypadku po prostu oblicz odsetek kobiet i mężczyzn skłonnych do udzielenia pomocy, c. Wybierz próbę ludzi i przeprowadź son¬daż, w którym zapytasz ich, do jakich or¬ganizacji należą. Przelicz następnie, czy kobiety częściej niż mężczyźni należą do organizacji, które odpowiadają po¬trzebie współczucia swoich członków. Ażeby uwzględnić fakt, że mężczyźni -albo kobiety - należą w ogóle do więk¬szej liczby organizacji, musisz postąpić następująco: dla każdego badanego ob¬liczasz odsetek organizacji związanych z realizacją skłonności do współczucia, do których należy. Sprawdź, czy kobiety mają wyższe niż mężczyźni przeciętne wyniki procentowe.

2. Czy studenci socjologii mają większą wiedzę
o świecie współczesnym niż studenci ra¬chunkowości?

a. Przygotuj krótki quiz na temat zagad¬nień z wiedzy o świecie współczesnym, następnie zaś przeprowadź go na zaję¬ciach dla studentów równoległych lat kierunków socjologii i rachunkowości. Jeśli chcesz porównać studentów ostat¬niego roku, upewnij się, z jakiej dzie¬dziny piszą prace magisterskie.

b. Zapytaj wykładowcę wiedzy o świecie współczesnym o przeciętne oceny stu¬dentów socjologii i rachunkowości na jego egzaminach.

c. Przyjdź na zajęcia dla studentów socjolo¬gii i na zajęcia dla studentów rachunko¬wości z petycją głoszącą „Nowy Jork sie¬dzibą ONZ". Policz tych, którzy podpiszą petycję, i tych, którzy powiedzą ci, że Nowy Jork jest przecież siedzibą ONZ.

3. Czy ludzie uważają za lepsze miejsce do
życia Nowy Jork czy Kalifornię?

a. Korzystając na przykład z Abstraktu Sta¬tystycznego dla Stanów Zjednoczonych lub innej tego typu publikacji, porównaj sto¬pę imigracji i emigracji dla każdego z tych

162

162

stanów. Sprawdź, czy są grupy migrujące bezpośrednio z Nowego Jorku do Kalifor¬nii lub na odwrót.

b. Ogólnokrajowe ośrodki badania opinii publicznej - na przykład Gallup, Harris, Roper i inne - często zadają ludziom pytanie, w jakim stanie żyje się ich zda¬niem najlepiej. Sprawdź w bibliotece albo w lokalnej gazecie kilka ostatnich wyników takich sondaży.

c. Porównaj liczbę samobójstw w obu sta¬nach.

4. Czy na twojej uczelni najpopularniejszymi wykładowcami są pracownicy wydziału nauk społecznych, przyrodniczych czy hu¬manistycznych?

a. Jeśli twoja uczelnia prowadzi ocenę prowadzących zajęcia przez studentów, sprawdź kilka ostatnich wyników i ob¬licz średnią dla każdej z trzech grup.

b. Chodź na zajęcia dla każdego z kierun¬ków w trzech grupach i obserwuj fre¬kwencję.

c. W grudniu wybierz grupę profesorów każdego z trzech kierunków i poproś ich, by notowali, ile świątecznych kartek i prezentów otrzymali od swoich studen¬tów wielbicieli. Sprawdź, kto wygrał.

Powyższe przykłady mają stanowić nie tyle sugestię wartych uwagi projektów badaw¬czych, ile ilustrację wielości możliwych sposo¬bów operacjonalizacji zmiennych.

Operacjonalizacja trwa

Mimo że omawiałem dotąd operacjonalizację i konceptualizację jako czynności poprzedza¬jące zbieranie danych i analizę - musisz na przykład ułożyć pytania kwestionariusza, zanim go rozdasz badanym - oba te procesy trwają również w toku procesu badawczego, nawet jeśli dane zbierane są w ustrukturyzowanym, masowym sondażu. Jak już widzieliśmy, w bada¬niach o mniej sztywnej strukturze, na przykład w badaniach terenowych, określenie i uszcze¬gółowienie odpowiednich pojęć nie dają się od¬dzielić od toczącego się procesu obserwacji.
Jako badacz musisz zawsze pozostać otwar¬ty na możliwość przeformułowania twoich pojęć i definicji. Ostatecznym celem badań społecz¬nych jest wyjaśnienie natury życia społecznego. Waga i użyteczność tego, czego się dowiesz na ten temat, nie zależy od momentu, w którym pierwszy raz zrozumiałeś, jak patrzeć na rzeczy¬wistość, podobnie jak nie zależy od tego, czy twój pomysł pochodzi z wyuczonego na pamięć podręcznika, ze snu czy też od szwagra.

Kryteria jakości pomiaru

Zaszliśmy już dość daleko. Ten rozdział zaczął się od ogólnego stwierdzenia, że socjologia może mierzyć wszystko, co istnieje. Potem od¬kryliśmy, że mierzone przez nas przedmiot) w większości nie istnieją. Następnie dowiedzie¬liśmy się, że mimo to można je jednak mierzyć Teraz kończymy ten rozdział omówieniem kilku standardów, zgodnie z którymi oceniamy nasz względny sukces lub porażkę w pomiarze przedmiotów - nawet takich, których nie ma.

Precyzja i poprawność

Zacznijmy od tego, że pomiarów można dokonywać z różnym stopniem precyzji. Jak już wi¬dzieliśmy przy okazji operacjonalizacji, precyzja dotyczy subtelności rozróżnień odrębnych war¬tości zmiennej. Opis kobiety jako „43-letniei" jest bardziej precyzyjny niż jako „po czterdziestce". Stwierdzenie, że gang uliczny powstał w le¬cie 1996 roku, jest bardziej precyzyjne nii stwierdzenie, że było to „w latach 90."

Pomiary precyzyjne mają w zasadzie prze¬wagę nad nieprecyzyjnymi, zgodnie ze wskaza¬niami zdrowego rozsądku. Nie ma okoliczność w których pomiar nieprecyzyjny miałby zasad¬niczą wyższość nad precyzyjnym. Mimo to jednak stuprocentowa precyzja nie zawsze okazje się konieczna czy pożądana. Jeśli informacja że kobieta jest po czterdziestce, wystarcza na potrzeby twoich badań, każdy dodatków;, wysiłek zmierzający do ustalenia jej dokładne¬go wieku należy uznać za zmarnowany. Przy

163

operacjonalizacji pojęć musisz więc częściowo kierować się wiedzą o wymaganym poziomie precyzji. Jeśli twoje potrzeby nie są jasne, sta¬raj się być raczej bardziej niż mniej precyzyjny.
Nie myl jednak precyzji z poprawnością. Opis osoby jako „urodzonej w Nowej Anglii" jest mniej precyzyjny niż jako „urodzonej w Stowe w vermont" - co jednak, jeśli osoba ta urodziła się w rzeczywistości w Bostonie? Opis mniej precyzyjny jest w tym przypadku Bardziej poprawny - lepiej bowiem odzwier¬ciedla rzeczywistość.
Precyzja i poprawność są oczywiście istotnymi cechami pomiaru badawczego i zapewne -nie ma potrzeby ich dłużej wyjaśniać. Badacze społeczni, tworząc i oceniając pomiary, zwra¬cają jednak szczególną uwagę na dwa aspekty techniczne: rzetelność i trafność.

Rzetelność

W ujęciu abstrakcyjnym rzetelność polega na rym, że dana technika, stosowana do tego samego przedmiotu, daje za każdym razem ten sam wynik. Powiedzmy, że chciałbyś wiedzieć, .e ważę. (Nie, nie wiem dlaczego). Jedną i technik byłoby zadawanie dwóm różnym osobom pytania o moją szacunkową wagę. Jeśli jedna z nich oceni moją wagę na 70, druga zaś na "40 kilogramów, będziemy musieli uznać, że technika opierająca się na ocenie mojej wagi przez innych ludzi nie jest szczególnie rzetelna.

Załóżmy jednak, że jako technikę pomiarową stosujesz wagę łazienkową. Wchodzę na wagę dwa razy, ty zaś za każdym razem notujesz wyniki. Byłyby one najprawdopodobniej identyczne, co dowodziłoby, że waga łazienko¬wa jest rzetelniejszą techniką pomiaru wagi danej osoby niż szacunkowa ocena dokonywa¬na przez innych ludzi.

Rzetelność nie zapewnia jednak, podobnie jak precyzja, poprawności wyniku. Załóżmy, że przestawiłem moją wagę tak, żeby odjąć sobie dwa czy trzy kilogramy dla poprawy samopo¬czucia. Mimo że odnotowałbyś za każdym ra¬zem (rzetelnie) taką samą wagę, za każdym ra¬zem byłbyś w błędzie. Ten nowy element, zwa¬ny obciążeniem, omawiam w rozdziale 8. Na
razie wystarczy nam ostrzeżenie, że rzetelność nie gwarantuje poprawności.
Załóżmy, że chcemy badać nastroje wśród robotników fabrycznych w dwóch różnych ty¬pach fabryk. W jednym zbiorze fabryk robotni¬cy wykonują prace wyspecjalizowane, co sta¬nowi konsekwencję bardzo zaawansowanego podziału pracy. Każdy z robotników przyczynia się w bardzo niewielkim stopniu do ogólnego procesu produkcji taśmowej. W drugim zbio¬rze fabryk każdy z robotników ma wiele zadań, przy czym niewielkie zespoły robotników wy¬konują cały proces produkcji.
Jak powinniśmy mierzyć nastroje? Jedna ze strategii mogłaby polegać na obserwacji robot¬ników w każdej z fabryk, ze szczególnym uwzględnieniem takich elementów, jak żarty, częsty śmiech, uśmiechy itp. Moglibyśmy też pytać, jak się im podoba ich praca, a nawet, czy zamieniliby ją na pracę drugiego badanego przez nas typu. Porównując obserwacje w róż¬nych fabrykach, moglibyśmy dojść do wniosku co do tego, która z form organizacji pracy lepiej wpływa na nastroje wśród robotników.
Zajmijmy się teraz problemem rzetelności tej metody. Po pierwsze, nasze samopoczucie podczas obserwacji zabarwi na pewno to, co widzimy. Możemy dokonać błędnej interpreta¬cji. Możemy zobaczyć robotników żartujących ze sobą i pomyśleć, że się kłócą. Możemy trafić na ich słaby dzień. Obserwując tę samą grupę robotników przez kilka dni z rzędu, moglibyś¬my codziennie dochodzić do innego wniosku. Kilku obserwatorów, oceniających te same za¬chowania, mogłoby również dojść do różnych wniosków co do nastrojów wśród robotników.
A oto inna możliwa strategia oceny nastro¬jów. Załóżmy, że sprawdzamy dokumenty fa¬bryki, by dowiedzieć się, jak wiele skarg zło¬żyły w danym okresie związki zawodowe. Przy¬puszczalnie byłby to jakiś wskaźnik nastrojów: im więcej skarg, tym gorsze nastroje. Tego typu strategia pomiaru wydaje się bardziej rze¬telna: licząc skargi kilka razy od nowa, wciąż otrzymywalibyśmy ten sam wynik.
Jeśli zastanawiasz się w tej chwili nad tym, czy liczba skarg jest naprawdę odzwierciedle¬niem nastrojów, martwisz się nie o rzetelność, lecz o trafność, o której za chwilę. Na razie chodzi

164

nam o to, że ta ostatnia metoda przypomi¬na moją wagę łazienkową: daje spójne wyniki. W badaniach społecznych kwestia rzetel¬ności pojawia się w wielu formach. Rzetelność staje się problemem zawsze, gdy źródłem da¬nych jest pojedynczy obserwator, ponieważ nie ma pewnego zabezpieczenia przed wpływem subiektywnego nastawienia tego obserwatora. Nie jesteśmy w stanie określić z pewnością, na ile otrzymane dane pochodzą z obserwowanych zjawisk, na ile zaś od samego obserwatora.
Subiektywność nie jest jednak jedynie problemem pojedynczego obserwatora. Bada¬cze sondażowi wiedzą już od dawna, że różni ankieterzy otrzymują różne odpowiedzi od ba¬danych, zależnie od własnych postaw i zacho¬wań. Albo gdybyśmy mieli zbadać stanowiska redakcji różnych gazet w jakiejś kwestii pu¬blicznej, moglibyśmy zatrudnić zespół kode¬rów, którzy zabraliby się za czytanie setek ar¬tykułów redakcyjnych i klasyfikowanie w zależ¬ności od stanowiska zajętego w tej kwestii. Niestety jednak różni koderzy będą różnie kla¬syfikować ten sam artykuł redakcyjny. Mogli¬byśmy też postanowić, że dokonamy klasyfi¬kacji kilkuset zawodów według jakiegoś stan¬dardowego klucza kodowego, na przykład zbioru kategorii stworzonego przez Departa¬ment Pracy czy przez Biuro Spisowe. Ty i ja nie umieścilibyśmy jednak wszystkich tych zawo¬dów w takich samych kategoriach.
Każdy z tych przykładów jest ilustracją problemu rzetelności. Podobne trudności poja¬wiają się, gdy staramy się uzyskać od ludzi in¬formacje o nich samych. Zadajemy czasem py¬tania, na które ludzie nie znają odpowiedzi: ile razy byłeś w kościele? Czasem pytamy ludzi o coś, co ich zdaniem ich nie dotyczy: czy jes¬teś zadowolony z aktualnego stanu stosunków dyplomatycznych między Chinami a Albanią? W takich przypadkach ludzie będą za każdym razem odpowiadać różnie, ponieważ wymyś¬lają odpowiedzi na bieżąco. Czasem badany temat bywa tak skomplikowany, że osoba, któ¬ra miała w tej sprawie jasne zdanie, może, gdy zadamy jej dane pytanie po raz drugi, dokonać zupełnie innej interpretacji problemu.
Jak więc tworzyć rzetelne mierniki? Jeśli projekt badawczy wymaga zadawania ludziom
pytań, musisz uważać, by zadawać wyłącznie pytania, na które respondenci prawdopodob¬nie znają odpowiedź. Pytaj o rzeczy, które ich dotyczą, jasno precyzując, o co właściwie py¬tasz. Wszystko to nie rozwiąże oczywiście każdego możliwego problemu z rzetelnością. Na szczęście jednak badacze społeczni wypra¬cowali liczne techniki krzyżowego badania rzetelności tworzonych mierników.

Metoda testu powtórnego

Czasem dobrze jest przeprowadzić ten sam pomiar więcej niż raz. Taką technikę nazywa¬my metodą testu powtórnego. Jeśli nie masz powodów, aby oczekiwać zmiany poszukiwa¬nych informacji, powinieneś otrzymać za każ¬dym razem tę samą odpowiedź. Jeśli odpowie¬dzi są różne, twoja metoda może być nierze¬telna - w takim stopniu, w jakim odpowiedz: są różne. Oto przykład.
W badaniach dotyczących oceny zagroże¬nia zdrowia (Health Hazard Appraisal - HHA*. będącej elementem profilaktyki, Jeffrey Sacks. W. Mark Krushat i Jeffrey Newman (1980) po¬stanowili określić ryzyko związane z różnym: czynnikami dotyczącymi otoczenia i stylu ży¬cia, co ułatwiłoby lekarzom należyte doradza¬nie pacjentom. Znając sytuację życiową pa¬cjenta, lekarze mogliby powiedzieć mu, jakie ma szansę dalszego życia, oraz poradzić, jak może je poprawić. Osiągnięcie tego celu zależało oczywiście w znacznym stopniu oc porawności informacji zebranych o każdym
badanym.
Aby sprawdzić rzetelność swoich infor¬macji, Sacks i jego współpracownicy poprossb wszystkich 207 badanych o wypełnienie pod¬stawowego kwestionariusza dotyczącego ich cech i zachowań. Trzy miesiące później w ko¬lejnym kwestionariuszu zadano badanym te same pytania i porównano wyniki. Okazało się że ogółem tylko 15% badanych podało w obe badaniach te same informacje. Sacks i jego koledzy piszą:

„Prawie 10% badanych w drugim badana podało inny wzrost. Wiek rodziców zmienił s* u niemal co trzeciego badanego - ojciec jednego

165

z badanych podobno postarzał się w ciągu trzech miesięcy o ponad 20 lat. Jeden na pięciu byłych palaczy lub alkoholików miał wyraźne problemy z dokładnym przypomnieniem sobie swoich dawnych nawyków konsumpcyjnych".
(1980, s. 730)

Niektórzy badani wymazali wszelkie ślady Podarowanych poprzednio szmerów serca, dłużycy, rozedmy płuc, aresztowań czy myśli samobójczych. Matka jednego z badanych marła zgodnie z pierwszym kwestionariu¬szem, wedle drugiego najwyraźniej żyła i cieszyła się dobrym zdrowiem. Jedna z badanych » pierwszym badaniu nie miała jajnika, w drugim badaniu natomiast miała go. W innym przypadku jajnik w pierwszym badaniu był, drugim natomiast okazało się, że nie ma go już od dziesięciu lat. Jedna z badanych zadeklarowała w pierwszym badaniu wiek 55 lat, rży miesiące później zaś już 50. (Należałoby się zastanowić, czy lekarze mogliby mieć na pacjentów tak wielki wpływ, jak ich własna pamięć). Tak więc metodą testu powtórnego 5r.vierdzono, że przyjęta metoda zbierania danych nie była zbyt rzetelna.

Metoda połówkowa

Co do zasady, dobrze jest robić więcej niż je-sen pomiar każdego skomplikowanego lub łożonego pojęcia społecznego, takiego jak ^przędzenia, alienacja czy klasa społeczna, Procedura ta daje podstawy dla innego spraw¬dzianu rzetelności. Załóżmy, że stworzyłeś kwestionariusz złożony z dziesięciu pytań, które w twoim przekonaniu mierzą uprzedzenia względem kobiet. Stosując metodę połów¬kową, mógłbyś losowo podzielić te dziesięć pytań na dwa zbiory pięcioelementowe. Jak wi¬dzieliśmy w rozważaniach na temat „wzajemnej wymienialności wskaźników" Lazarsfelda, każdy zbiór powinien stanowić dobry mier¬nik uprzedzeń wobec kobiet, a oba zbiory powinny prowadzić do takiej samej klasyfikac¬ji respondenta. Gdyby klasyfikacja ludzi wy¬padła różnie według każdego ze zbiorów py¬tań, najprawdopodobniej masz problem z rze¬telnością pomiaru tej zmiennej.

Stosowanie ustalonych mierników

Innym sposobem zapewnienia rzetelności in¬formacji otrzymywanych od ludzi jest stosowa¬nie mierników, których rzetelność została udo¬wodniona w poprzednich badaniach. Mierząc na przykład anomię, mógłbyś pójść śladami Srole'a.

Jednak powszechne stosowanie miernika nie daje gwarancji jego rzetelności. Na przykład Testy Umiejętności Szkolnych (Scholastic Aptitu-de Tests) oraz Wielofazowa Skala Osobowości Minnesota (Minnesota Multiphasic Personality In-ventory - MMP/) przyjęły się w ciągu dziesięcio¬leci jako ustalone standardy w swoich dziedzi¬nach. Jednak w ostatnich latach potrzebne oka¬zały się ich fundamentalne zmiany, które pozwoliły uwzględnić przemiany społeczne oraz wyeliminować przestarzałe tematy i seksistowskie obciążenie sformułowań.
Rzetelność osób zatrudnionych przy realizacji badań

Jak już wyżej wspomniałem, pomiar może się okazać nierzetelny także z powodu osób za¬trudnionych przy realizacji badań, takich jak an¬kieterzy czy koderzy. Sprawdzenia rzetelności można w tym przypadku dokonać na kilka spo¬sobów. Powszechną praktyką zabezpieczania się przed nierzetelnością ankieterów w bada¬niach sondażowych jest zatrudnianie kontrole¬ra, który przeprowadza rozmowy telefoniczne z respondentami z wybranej podpróby i weryfi¬kuje w ten sposób niektóre informacje.
W innych sytuacjach przydatne może się okazać powtórzenie badań. Jeśli sądzisz, że ar¬tykuły redakcyjne lub zawody mogą nie zostać rzetelnie sklasyfikowane, możesz kazać je za¬kodować niezależnie od siebie różnym kode¬rom. Przypadki zakodowane w sposób niespój¬ny można wówczas ocenić bardziej dokładnie i rozwiązać problemy.
Jasność, precyzja i praktyka mogą wreszcie oszczędzić ci wielu problemów z rzetelnością. Gdybyśmy poświęcili trochę czasu na porozu¬mienie się co do sposobu oceniania stanowiska redakcji w jakiejś sprawie - omawiając rozmai¬te możliwości i czytając razem niektóre artykuły

166

- udałoby się nam prawdopodobnie zakla¬syfikować je niezależnie w ten sam sposób.
Rzetelność pomiaru to kwestia fundamen¬talna dla każdych badań społecznych. Będzie¬my do niej wracać niejednokrotnie w następ¬nych rozdziałach. Tymczasem jednak postaraj się zapamiętać, że nawet pełna rzetelność nie daje gwarancji, że nasze pomiary dotyczą właśnie tego, co sądzimy, że jest mierzone. Zajmijmy się teraz kwestią trafności.

Trafność

W zwyczajowym ujęciu trafność odnosi się do zakresu, w jakim miernik empiryczny adekwat¬nie odzwierciedla prawdziwe znaczenie dane¬go pojęcia. Ha! Przecież zgodziliśmy się już co do tego, że pojęcia nie mają prawdziwego zna¬czenia. Jak więc możemy określić, czy dany miernik adekwatnie odzwierciedla znaczenie pojęcia? Oczywiście, ostatecznie nie możemy. Zarazem jednak, jak już widzieliśmy, całość zjawisk społecznych, włącznie z badaniami społecznymi, bazuje na porozumieniu co do znaczeń używanych terminów i odpowiadają¬cych im pojęć. Istnieje kilka kryteriów udanego pomiaru odpowiadającego uzgodnionym zna¬czeniom pojęć.

Po pierwsze, istnieje tak zwana trafność fa¬sadowa. Konkretny miernik empiryczny może się zgadzać albo nie zgadzać z naszymi uzgod¬nieniami i indywidualnymi obrazami mentalny¬mi dotyczącymi danego pojęcia. Ty i ja mogli¬byśmy się na przykład spierać co do adekwat¬ności pomiaru nastrojów wśród robotników na podstawie liczby skarg związków zawodowych. Zgodzilibyśmy się jednak z pewnością, że skar¬gi te mają coś wspólnego z nastrojami wśród ro¬botników. Oznacza to, że miernik ten jest tra¬fny „co do fasady", niezależnie od tego, czy jest zadowalający. Gdybym chciał mierzyć nastroje wśród robotników liczbą książek wypożycza¬nych przez nich z biblioteki w czasie wolnym, twoje obiekcje byłyby niewątpliwie poważniej¬sze: ten miernik nie miałby wiele wspólnego z trafnością fasadową.

Po drugie, jak już wskazywałem wcześniej, istnieje wiele bardziej formalnie ustalonych
konwencji co do znaczenia pojęć. Biuro Spisowe stworzyło na przykład definicje operacyjne pojęć takich jak rodzina, gospodarstwo domo¬we czy status zatrudnienia, które wydają s* praktycznie trafne w większości badań wykorzystujących te pojęcia.

Trzy inne typy trafności określają także konkretne sposoby sprawdzania trafności mierników. Pierwszy z nich, trafność kryterialna, zwana niekiedy trafnością predykcyjną, opiera się na jakimś kryterium zewnętrznym. Na przykład trafność egzaminów na studia przejawia się w możliwości przewidywania na podstawie przyszłych sukcesów studenta. Trudność pisemnych testów na prawo jazdy je«j w tym sensie określona przez zależność miedzy wynikami zdających a ich późniejszymi doświadczeniami jako kierowców. W tych dwóch! przykładach sukcesy studenta i umiejętności kierowcy są owymi kryteriami.
Aby przekonać się, na ile zrozumiałeś i trafności kryterialnej, sprawdź, czy pot wymyślić zachowania, które mogłyby ocenie trafności następujących postaw:
Jest bardzo religijny
Popiera równouprawnienie kobiet i mężczyzn
Popiera skrajnie prawicowe ugrupowania
paramilitarne Troszczy się o środowisko naturalne

Wśród możliwych kryteriów mogłyby znaleźć na przykład: uczęszcza do koście głosuje na kobiety, należy do NRA, należy Klubu Sierra. Niekiedy niełatwo znaleźć rów: bezpośrednie kryteria behawioralne trafności. W takim przypadku można jednak przybliżyć się do takich kryteriów, stosując inny te Możemy zastanowić się, jak dana zmienna winna być, teoretycznie, powiązana z innym zmiennymi. Trafność teoretyczna opiera się n logicznych powiązaniach między zmiennym:
Załóżmy na przykład, że zamierzasz badać źródła i konsekwencje satysfakcji z pożycia małżeńskiego. W ramach badań opracowujesz miernik owej satysfakcji, po czym sprawdzasz jego trafność.
Oprócz miernika wypracowałeś również pewne przewidywania teoretyczne co do rela¬cji między satysfakcją z pożycia małżeńskiego

PRZEJDŹ NA FORUM