Úvodní stránka » Archiv čísel » Články 01/2017 » Využití Q metodologie pro konstrukci vlastního měřícího nástroje

Využití Q metodologie pro konstrukci vlastního měřícího nástroje

František Kalvas

Abstrakt

Stať ukazuje, jak lze využít Q metodu pro konstrukci vlastních měřících nástrojů. Q metoda je komplexní technika sběru a analýzy dat, která se snaží o co nejobjektivnější zkoumání subjektivních pohledů na vybraný objekt. Konstrukce vlastního nástroje pak je velmi podrobně demonstrována na příkladu výzkumu náboženské kolektivní paměti. Využíváme soubor 48 výroků převzatých z denního tisku z let 2010–2013, výběr byl založen na vyhledávání klíčových slov a diskusích členů výzkumného týmu. Výroky se týkají významných osobností, událostí a míst českých dějin a významných svátků, polovina výroků nese náboženskou interpretaci, polovina důsledně ne-náboženskou. Tento soubor výroků hodnotilo 46 participantů vybraných úsudkem, z jejich hodnocení jsme extrahovali dva pohledy na roli náboženství v dějinách a pro každý pohled jsme zkonstruovali jednu Likertovu škálu. Vytvořené škály jsme použili v rámci reprezentativního výběrového šetření, kde bylo v prvním kole dotázáno 1004 respondentů a ve druhém 311 rodičů nebo dětí respondentů z prvního kola. Do prvního kola byli respondenti vybíráni pomocí stratifikovaného náhodného výběru, přičemž strata byla definována na základě kraje a velikosti místa bydliště. Ve druhém kole byly osloveny téměř všechny kontakty získané v prvním kole. Na výsledcích z tohoto šetření prakticky demonstrujeme, že škály zkonstruované díky Q metodě nám umožní postihnout mezigenerační vývoj jednotlivých pohledů, ale neumožní nám změřit, který pohled je ve zkoumané populaci více zastoupený.

 

Abstract

The paper shows how to use the Q methodology for constructing own measuring tools. The Q methodology is complex technique of data collection and analysis for the most objective researching of subjectivities. We demonstrate the construction of our own measuring tool on example of religious collective memory in close detail. We use set of 48 sentences taken from daily press from years 2010–2013, the selection of sentences is based on a key-word search and discussions of the research team. These sentences involve important Czech historical persons, events, places and holidays; one half of sentences reflects religious interpretation, and the other half is strictly non-religious. The set is rated by 46 participants sampled intentionally. We use their ratings for an extraction of two subjectivities and we construct a Likert scale for each subjectivity. We use scales for a survey questionnaire. We administer the survey in two rounds, in the first round we ask a random sample of 1004 respondents and in the second round we ask a sample of 311 children or parents of respondents from the first round. We select respondents for the first round by random stratified sampling, strata are based on the region and size of settlement of residence. In the second round, we address almost all contacts received in the first round. Our survey results showed that the constructed scales allowed us the comparison of generations, but it was not possible to tell which subjectivity was the most dominant in the population.

Klíčová slova

Q metoda; výběrové šetření; Likertova škála; náboženská kolektivní paměť

Keywords

Q methodology; survey; Likert scaling; religious collective memory

Podpořeno grantem:

Práce na této stati, včetně sběru použitých dat, byla podpořena grantem GA ČR „Kontinuita a diskontinuity v náboženské paměti v České republice“ reg. č. 14-01948S.

  1. Úvod

V evaluační praxi nemusíme mít za úkol pouze zhodnocení objektivních indikátorů – naším cílem může také být, co nejlépe uchopit subjektivní pohledy na problém, stav zkoumané organizace, značku, dotační program či jakýkoli další objekt našeho výzkumného zájmu. Pro účely co možná nejobjektivnějšího zpracování subjektivních pohledů, především pro jejich typologii, byla vyvinuta Q metoda. V letech 1935 a 1936 ji odbornému publiku představil sérií článků v respektovaných časopisech britský psycholog William Stephenson [1935a, 1935b, 1936a, 1936b, 1936c]. Ilustrativní příklady Q metody v těchto článcích pokrývají velmi pestrou paletu témat, jsou to: obliba barev, obliba historických váz, příjemnost vůní, nálady jako osobnostní charakteristika a fyzické vlastnosti osob.

Q metoda představuje několik výzkumných kroků. Nejprve nám pomáhá ze současného diskursu vybrat vhodné výroky, které představují subjektivní popisy zkoumaného objektu či vztahu k němu. Případně nám pomáhá vybrat sadu objektů, které budou subjektivně hodnoceny. Výroky, nebo objekty pak hodnotí skupina posuzovatelů, přičemž je při hodnocení nucená dodržet předepsané rozdělení. Z takového hodnocení se pak dají vyvodit základní typy komplexních pohledů na vybranou sadu výroků, či objektů a také se dá určit, které výroky, nebo objekty jsou klíčové a poměrně spolehlivě štěpí jednotlivé základní typy pohledů.

Q metoda je syntézou kvalitativního a kvantitativního přístupu, z čehož plynou i její silné a slabé stránky. Není to izolovaný nástroj, představuje ucelený a propojený komplex způsobu sběru a analýzy dat [Nekola 2012]. Největší předností je zřejmě možnost uchopit a typologizovat subjektivní pohledy na problém, organizaci, značku atp., a to rigorózním a opakovatelným způsobem [McKeown, Thomas 2013]. Přitom metoda umožňuje také zjistit, v čem se nalezené pohledy liší a v čem se překrývají [Nekola 2012]. Tato metoda umožňuje replikovatelným způsobem sebrat a vyhodnotit bohaté množství dat i o malé populaci (např. zaměstnanci jedné malé firmy). Q metoda nutí participanty více promýšlet odpovědi tím, že se tito musí při hodnocení držet předepsaného rozdělení, a tudíž se dá předpokládat, že jsou jejich odpovědi blízko jejich skutečnému postoji [ibid.]. Q metoda je také považována za vhodný nástroj pro tvorbu Likertových škál [Havlíková 2016].

Za největší slabinu Q metody považujeme fakt, že byla vyvinuta pro zkoumání bohatých dat o subjektivitě menší skupiny jedinců – pokud ji použijeme pro jiné účely, čelíme řadě problémů. Klíčovou slabinou realizace Q metody je správně sestavená sada výroků či objektů, které budou participanti hodnotit a vyjadřovat tak svou subjektivitu – špatně zvolená sada neumožní správně vyjádřit subjektivitu [Nekola 2012; Havlíková 2016]. Často také dochází k zásadnímu nepochopení podstaty Q metody, když od ní očekáváme reprezentativní výsledky pro celou populaci. Tato metoda dokáže spolehlivě extrahovat sdílené pohledy již na základě vzorku několika desítek jedinců, ale není schopná určit poměrné zastoupení těchto pohledů v celé populaci [ibid.]. Konečně, Q metoda je časově náročná [Havlíková 2016], a to především ve fázi sběru dat – připravit dotazovací nástroj je náročnější než příprava běžného dotazníku, podobně je pro participanty náročnější samotné dotazování.

V současné době se Q metoda rozšířila daleko za hranice psychologie, kde vznikla, a používá se v širokém spektru témat. Např. Charles H. Davis a Carolyn Michelle [2011] použili Q metodu pro analýzu filmových publik, Brendy A. Kennedy [2013] pro typologii úředníků vzhledem k tomu jak vnímají svou roli v zastupitelské demokracii, Emma Logo [2013] pro vědomí dopadu dopravy na životní prostředí, Eun-Ho Ha [2017] pro status profese zdravotních sester, Sofie Wouters s kolegy [2017] pro postoje veřejnosti k nastavení zdravotní péče o osoby v terminálním stádiu nemoci a Jasper Katomero s kolegy [2017] pro identifikaci postojů poslanců parlamentu v Tanzanii ke konceptu vykazatelnosti. Bylo by možné uvést mnoho dalších současných a také starších studií.

Pestrost témat ilustruje i využití metody v České Republice, kde je metoda využívána nejčastěji (ale nikoli exklusivně) v oblasti pedagogického výzkumu. Použili ji např. Jitka Kropáčová [2005] pro typologii přístupů učitelů k žákům v dvojjazyčném prostředí, Kateřina Homolová [2007] pro analýzu podobnosti postojů ke čtení mezi učiteli a žáky 7. a 8. tříd základní školy, Lukáš Zagata [2010] pro analýzu postojů českých ekologických zemědělců, Martin Nekola [2012] pro typologii postojů aktérů drogové politiky k této politice, Jarmila Honzíková a Jan Janovec [2012] pro hodnocení metod a forem výuky psychomotorických dovedností, Josef Navrátil s kolektivem [2013] pro hodnocení turistické atraktivity míst, Jaroslav Vala [2014] pro preferenci poezie, Stanislav Mokrý a Ondřej Dufek [2014] pro segmentaci turistů, Jiří Dostál [2015] pro obecný model pedagogických kompetencí, Jan Kubrický a Pavlína Částková [2015] pro typologii pedagogických kompetencí ohledně využití webových stránek ve výuce, Jana Matošková s kolektivem [2016] pro tvorbu nástroje na měření tacitních znalostí a tvorbu typologie strategií úspěšného vysokoškolského studia a Michaela Havlíková [2016] pro vnímání filmového festivalu hostitelskou populací.

V dalším textu článku se již nebudeme věnovat přehledu oblastí a témat, kde je Q metoda využívána – kvalitní a podrobnější přehledová kapitola není záměrem článku a přesahuje skromné schopnosti a zkušenosti autora. Záměrem je poukázat na potenciál Q metody pro evaluační praxi a především sdílet nabyté znalosti o této metodě a zkušenosti z její praktické aplikace. V předkládaném textu si tedy v první části Q metodu obecně představíme, včetně jejích základních principů a jednotlivých kroků její aplikace. Rozebereme také možnosti, jak výstupy z Q metody využít při přípravě výběrového šetření, konkrétně, jak pomocí Q metody vyvinout vlastní měřící nástroje. V druhé části budeme použití Q metody demonstrovat na vývoji měřícího nástroje pro výzkum náboženské kolektivní paměti. Budou podrobně vysvětleny jednotlivé kroky a důsledky jednotlivých rozhodnutí. Pro čtenáře tak bude snadné představený postup aplikovat na vlastní problém z evaluační praxe. Z demonstrace postupu v druhé části bude také patrné, jaké zkušenosti nám tato aplikace Q metody přinesla: (1) Q metoda je relativní měřící nástroj, což platí i pro naše vlastní nástroje, které jsou na ní založené, (2) přestože je Q metoda do velké míry robustní vůči nízké reprezentativitě zkoumaného vzorku, brutální porušení reprezentativity ovlivní výsledky, a (3) vyplácí se neexperimentovat a držet se osvědčeného postupu Q metody.

  1. Kroky a principy Q metody

Tvorba Q sample

Prvním krokem Q metody je výběr výroků z určité problémové oblasti
– vytvoření tzv. Q sample. Tyto výroky reprezentují různé pohledy na problém, jeho různé interpretace a řešení. Stručně řečeno, měly by být shrnutím toho nejpodstatnějšího, co bychom mohli slyšet od zastánců různých pohledů na daný problém. Většinou jde o vyhledávání z dostupných zdrojů, jako je např. tisk, strategické dokumenty, oficiální vyjádření atp. Pokud bychom však řešili případovou studii, která by měla např. rozkrýt problém špatného fungování konkrétní nemocnice, pak je na místě si pohledy jednotlivých aktérů opatřit pomocí polostrukturovaných rozhovorů.

Q metoda používá pojem concourse, kterým chápe „proud komunikace, která obklopuje jakékoli téma, ať už jde o konverzaci, komentáře nebo diskurs každodenního života“ [Nekola 2012: 61]. Nemusí však vždy jít o verbální vyjádření. Některé studie použily fotografie, jiné vůně, obrázky, reklamy, politické plakáty, country music a jiné [McKeown, Thomas 2013]. Z concourse pro námi studovaný problém se v první fázi snažíme nashromáždit co nejvíce materiálu – článků, diskusí, fotografií, rozhovorů, vůní atd., tj. materiálu, který naše studie vyžaduje. A je také možné kombinovat různé zdroje – je to však využíváno pouze pro psaná sdělení, kdy v concourse můžeme kombinovat výňatky z tisku s komentáři čtenářů blogu, s hodnocením expertů, s oficiálními dokumenty atd. [ibid.].

Pro vytvoření Q sample se používá několik postupů. První možností je použít nějaký seznam objektů, např. zvířat pro studii vztahu lidí k různým zvířatům. Tento postup lze využít jen tam, kde nejde o posuzování subjektivních tvrzení, ale subjektivní vztah k objektům, např. respondenti by řadili zvířata podle toho, jak jsou jim sympatická, nebo jak jim připadají užitečná atp. Nemusí jít však o objektivní seznam, lze použít položky z nějakého zavedeného testovacího nástroje, např. by se mohli respondenti sami hodnotit pomocí výroků ze škály síly osobnosti [Jeřábek 2003]. Příbuzným postupem je adaptování Q sample z tematicky příbuzné studie nebo dokonce některého z mála existujících standardizovaných Q sample [McKeown, Thomas 2013].

Druhý způsob je výběr úsudkem. Má dvě základní varianty – nestrukturovaný Q sample a strukturovaný Q sample. V první variantě se snaží výzkumníci co nejlépe shrnout pohledy na zkoumaný problém. Pouze jejich vzájemné diskuse zajišťují, že nezůstane nějaký významný názor opominut. K tomuto postupu výzkumníci musí často sahat ve chvílích, kdy není dostatečně rozvinutá teorie v oblasti, kterou zkoumají. Rozvinutá teorie nám umožní využít druhou variantu – strukturovaný Q sample. V této variantě vybíráme jednotlivé položky do Q sample tak, aby co nejlépe reprezentovaly jednotlivé dimenze teoreticky definovaného problému. Často se vychází z principů tvorby experimentálního designu – aby všechny podstatné dimenze byly rovnoměrně obsazené. Tam kde máme u experimentu jednotlivé kontrolované a testové proměnné a jejich hodnoty, tam při tvorbě Q sample máme jednotlivé pohledy a výroky, které těmto pohledům odporují nebo konvenují. Také součástí této systematické varianty jsou diskuse výzkumného týmu o kandidátech na položky nejlépe reprezentující dimenze pohledů na problém a jejich póly [ibid.].

Q sort – hodnocení položek Q sample

Poté, co máme vybraný Q sample, přichází na řadu klíčová fáze, která se nazývá Q sort. V ní respondenti hodnotí jednotlivé položky Q sample. Hodnocení probíhá tak, že respondenti seřadí jednotlivé položky Q sample podle zadaných instrukcí. Tou instrukcí je obvykle, aby respondenti řadili položky dle toho, jak moc vyjadřují jejich přesvědčení, nebo jak moc s nimi souhlasí, nebo jak moc je vystihují atp. Obvykle je tedy užíván jeden pohled na Q sample, podle kterého má být tento roztříděn. Najdeme však příklady studií, kde jsou respondenti požádáni provést třídění tři, každé z jiné perspektivy – např. jak výstižně položky popisují mne osobně, jak jsou výstižné pro popis běžné populace a jak moc vyjadřují základní etické hodnoty daného náboženství. Instrukce však mohou zahrnovat hypotetické situace, či scénáře [ibid.].

Samotný způsob hodnocení je asi největší devizou Q metody. Q sort stanovuje pro každý stupeň souhlasu či nesouhlasu přesný počet položek, který má být vybrán. Počty někdy připomínají normální distribuci, kdy u krajních stanovisek (maximální souhlas/maximální nesouhlas) má být vybrán nejmenší počet položek a pro neutrální (nevím, nedovedu zařadit, ani souhlas ani nesouhlas atp.) naopak největší. Častěji se počet položek od krajů ke středu mechanicky zvyšuje. Pro usnadnění obdrží každý respondent všechny položky vytištěné na kartičkách spolu s velkým archem papíru (obvykle velikosti A3) na kterém je naznačena osa -4, -3 … 0 … +3, +4 a nad každým stupněm je tolik prázdných okének o velikosti kartičky, kolik pro daný stupeň požadujeme položek. Úkolem respondentů pak je kartičky roztřídit do prázdných okének a všechna je zaplnit tak, aby uspořádání kartiček co nejlépe odpovídalo přesvědčení respondenta. Klíčové je, aby respondenti především dodržovali relace – aby položky, se kterými souzní více, byly napravo od těch, se kterými souzní méně.

Pseudo-normální rozdělení počtu položek a rozmezí škály od -4 do +4 nejsou nutně jedinou možností jak Q sort uspořádat. Bruce F. McKeown a Dan B. Thomas [2013] uvádějí, že pro Q sample o velikosti do 40 položek je bezpečné užít škálu od -4 do +4, při 40 až 60 položkách se nejčastěji užívá škála od -5 do +5. Nejčastěji má Q sample 40 až 50 položek a Q sort má plošší pseudo-normální rozdělení. McKeown a Thomas [ibid.] k tomu dodávají, že byť je tento případ nejčastější, využívají se i jiné způsoby rozdělení počtů položek pro jednotlivé stupně souhlasu. Pokud očekáváme poměrně vyhraněné názory na problém u našich respondentů, můžeme použít ještě plošší distribuci, relativně se tak zvýší podíl počtu položek na extrémních koncích škály. Je možné použít i převrácenou normální distribuci, kdy bude na extrémní okraje škály umístěno více položek než do středu.

Doporučený postup třídění položek Q sample je následující. Respondent si nejprve položky prostuduje, pak je roztřídí na tři hromádky podle toho, zda s nimi souhlasí, nesouhlasí, nebo k nim má neutrální postoj. Pak je dobré umístit položky, se kterými nejvíce souzní (+4 v našem případě), poté vybrat položky, se kterými souhlasí nejméně (-4). Doporučuje se pak doplnit mírnější souhlas (+3) a po něm ihned mírnější nesouhlas (-3) a dále postupovat ve střídání pólů škály až dojde k prostřední kategorii (0). Průběžně samozřejmě porovnává přilehlé kategorie, jestli rozmístění položek odpovídá míře jeho souhlasu či nesouhlasu. Postup třídění od krajů do středu vychází z poznatků psychologie, že jedinci si jsou obvykle mnohem více jistí extrémními než umírněnými postoji. Nakonec jsou na hlavní arch přepsána čísla položek a tím je podoba Q sortu pro daného respondenta zaznamenána [ibid.]. Arch může být doplněn osobními charakteristikami respondenta, a pokud měl respondent za úkol hodnotit položky z různých perspektiv, určitě je třeba zaznamenat, kterou perspektivu užil při třídění na příslušném archu.

Rozdíl mezi měřením pozice položek pomocí Q sort a klasických škál příhodně ilustruje článek Havlíkové [2016], která zjišťovala názor obyvatel Karlových Varů ohledně toho, jaké jevy (negativní i pozitivní) vyvolává zdejší filmový festival. V rámci Q sortu respondenti řadili 23 vybraných jevů na pětibodovou škálu souhlasu podle pseudo-normálního rozdělení (1: 3x; 2: 5x; 3: 7x; 4: 5x; 5: 3x). Měsíc před tím hodnotili titíž respondenti stejných 23 jevů klasickým způsobem, vyjádřili s nimi stupeň souhlasu na stejné škále (1 = rozhodný souhlas, 3 = neutrální, 5 = rozhodný nesouhlas). Havlíková uvádí, že data získaná pomocí klasické škály byla reliabilnější než ta získaná pomocí Q sort (Cronbachova alfa: 0,9 vs. 0,7). Dále, pomocí klasického postupu získala více souhlasných odpovědí: u 15 položek byla modusem kategorie „rozhodně souhlasí“ u zbylých 8 položek „souhlasí“, což není možné docílit pomocí Q sort.

Je také poučné prostudovat v článku Havlíkové tabulku Table 2, která srovnává průměrný stupeň souhlasu s jednotlivými položkami měřený pomocí Q sort a klasického hodnocení. Např. alkoholismus, který získal 3. nejvyšší průměrný souhlas při klasickém měření, získal v Q sort 12. nejvyšší průměrný souhlas; přetížení služeb se při klasickém měření umístilo jako 7., ale při Q sort až jako 20.; možnost nových investic se v Q sort umístila jako 23., poslední, při klasickém měření ale byla na 16. místě; zvýšení hrdosti místních se v Q sort umístilo jako 6., ale při klasickém měření bylo na 22. místě atd. Zkrátka, Q sort produkuje odlišné pořadí položek, nejde jen o odlišný rozsah škály a odlišné vzdálenosti mezi položkami. Hlavní rozdíl je zřejmě v tom, že klasický postup umožňuje rychlé hodnocení, respondenti berou každou položku v úvahu jen jednou a již se k ní nevrací, Q sort však vyžaduje více času a respondenti zvažují pozici položek opakovaně. Momentálně, Bohu žel, neexistuje literatura, která by se věnovala systematickému srovnání rozdílů mezi Q sort a klasickým přístupem.

Výběr respondentů a analýza dat z Q sort

Výběr jedinců pro Q sort provádíme většinou úsudkem. Soubor respondentů se v Q metodologii nazývá P sample nebo někdy P-set a jeho velikost se nejčastěji pohybuje mezi 30 až 50 jedinci. Jeho konstrukce se obvykle řídí úsudkem výzkumníka a potřebou použité teorie – vybíráme takové typy respondentů, jejichž subjektivitu chceme mít v P sample dobře zastoupenou. V případě studia nějakého sociálního problému se obvykle vybírá do P sample několik respondentů za každý typ aktérů, jichž se problém týká. Nemusíme však typy respondentů rozlišovat a můžeme zařadit do P sample kohokoli – pokud můžeme předpokládat, že zkoumáme nějaký druh obecné subjektivity, který by měl fungovat u všech jedinců zhruba stejně, a je proto zbytečné při výběru jedinců nějak pečlivě rozlišovat. Někdy je – podobně jako u tvorby Q sample uplatněn faktoriální design. A to v případě, kdy se domníváme, že subjektivitu jedinců zásadním způsobem štěpí některé jejich vlastnosti (např. rasa a pohlaví), pak dbáme, aby tyto znaky byly v P sample rovnoměrně zastoupené (např. 10 bělochů, 10 bělošek, 10 afro-Američanek, 10 afro-Američanů) [McKeown, Thomas 2013].

Sebraná data se zaznamenávají v převráceném formátu – jednotlivé řádky odpovídají jednotlivým výrokům a jednotlivé sloupce respondentům – a je na ně aplikována faktorová analýza. Zde je třeba dát pozor již při přípravě Q sample a P sample, aby byl počet hodnocených položek vyšší než počet respondentů. Faktorová analýza totiž funguje spolehlivě pouze na souborech, kde je vyšší počet pozorovaných případů než proměnných. A jelikož v převrácené datové matici odpovídají respondenti proměnným a položky případům, je třeba, aby byl počet položek vyšší než počet respondentů. Jak víme, faktorová analýza extrahuje z dat latentní faktory, které ovlivňují proměnné, které pozorujeme a měříme [Comrey, Lee 2013].

Pokud analyzujeme běžná data, např. různé politické postoje, nemáme problém si latentní faktory představit. Co si ale představit pod latentními faktory v případě, kdy proměnné představují jednotliví respondenti? Domníváme se, že to je pohled na věc či problém, který je daným respondentům společný. Faktorové zátěže nám pak říkají do jaké míry hodnocení té či oné položky souvisí z extrahovaným pohledem, latentním faktorem. Pro snazší interpretaci a pojmenování pohledů (latentních faktorů) je možné použít některý z typů rotace faktorů, který u faktoru maximalizuje zátěž v případě některých položek a minimalizuje ji u všech ostatních. Je to vhodné právě proto, že přesně takto o komplexních pohledech na problém uvažujeme: že výrazně ovlivní naše odpovědi na některé otázky a nechá nás zcela chladné v případě jiných otázek. Popsání latentních faktorů a jejich souvislostí je konečným výstupem ze samotné Q metody.

Konstrukce vlastního měřícího nástroje

Na Q metodu je možné navázat dalším šetřením. Pokud jsme identifikovali základní komplexní pohledy na zkoumaný problém v rámci našeho P sample, může nás zajímat, jaká by byla distribuce těchto komplexních pohledů v rámci širší populace. Vzít však Q sample a předložit jej reprezentativnímu souboru cca 1000 respondentů je však nemožné (organizačně a analyticky – počet respondentů by převýšil počet výroků).

První řešení, které se nabízí, je nechat reprezentativní vzorek respondentů ohodnotit položky Q sample pomocí posuzovacích škál (např. -4 pro maximální nesouhlas a +4 pro maximální souhlas) a díky výsledkům Q metody konstruovat pro každý pohled jednu Likertovu škálu. To provedeme tak, že z Q metody převezmeme faktorové zátěže jednotlivých položek Q sample. Tato zátěž (factor loading) nám říká, jak moc je daná položka ve shodě či v rozporu s extrahovaným pohledem, latentním faktorem. Pro každou položku Q sample máme tolik zátěží, kolik jsme se rozhodli nakonec extrahovat komplexních pohledů. Pokud chceme vytvořit Likertovu škálu pro vybraný komplexní pohled, převezmeme z Q metody faktorové zátěže položek Q sample pro příslušný latentní faktor a jednotlivá hodnocení položek ve výběrovém šetření těmito zátěžemi vynásobíme a pak sečteme. Výsledné číslo odpovídá umístění příslušného respondenta z výběrového šetření na Likertově škále pro příslušný komplexní pohled.

V praxi nebudeme používat celý Q sample pro výběrové šetření. V rámci Q sort respondenti udrží pozornost, ale hodnotit např. 40 či 50 položek pomocí stejné posuzovací škály v rámci strukturovaného rozhovoru, to je pro dotázané příliš obtížný úkol. Budeme tedy muset počet položek redukovat a vybrat jen některé. Budeme vybírat ty, které mají schopnost co nejlépe odlišovat jednotlivé extrahované latentní faktory. Budeme tedy vybírat takové položky, které mají pro jeden faktor vysokou zátěž (kladnou či zápornou) a pro ostatní faktory nízkou (ideálně nulovou) zátěž (loading), případně položky, které mají vysokou kladnou zátěž pro jednu část latentních faktorů a vysokou zápornou pro jinou část latentních faktorů. Je zřejmé, že takové položky mají schopnost od sebe odlišovat respondenty s odlišným pohledem na zkoumaný problém. Likertovy škály pak vytvoříme pouze na základě vybraných položek jen ty budeme v reprezentativním šetření dotazovat, jen jejich zátěže přebereme z výsledků Q metody a jen pro ně budeme zátěžemi násobit odpovědi respondentů v reprezentativním šetření a budeme je sčítat do výsledných škál.

Stantor Danielson [2009] nabízí ještě další dva způsoby, jak výsledky Q metody v reprezentativním šetření využít. Pro pořádek uveďme, že námi intuitivně nastíněný způsob, který jsme popsali výše, nazývá Danielson tvorba škály (scale creation). Dalším způsobem je korelace profilů (profile correlation). Každou latentní proměnnou, tedy extrahovaný komplexní pohled, si uložíme jako ideální typ, tj. jak by jednotlivé vybrané položky Q sample hodnotila osoba, která naprosto příslušný pohled sdílí. Odpovědi odvodíme z velikosti zátěže a rozsahu nabízené hodnotící škály. Poté transponujeme datovou matici, tj. z respondentů se stanou proměnné a z položek případy, a spočítáme pro každého respondenta z výběrového šetření, jak moc jeho odpovědi korelují s každým ideálním typem. Velikosti korelačních koeficientů si zaznamenáme a uložíme je do datového souboru jako nové proměnné po té, co datovou matici transformujeme nazpět (respondenti budou opět tvořit případy a hodnocení položek proměnné). Danielson poté doporučuje hodnoty koeficientu menší než 0,4 nahradit nulou a větší než 0,4 (včetně) 1, čímž pak získáme identifikátor, že vybraný respondent významně koreluje ve svém pohledu na problém s ideálním typem [ibid.].

Posledním způsobem je narativní zhodnocení (narative evaluation). To je zcela odlišným způsobem řešení od všech předešlých. Jeho specifičností je, že místo matematických operací se pokusíme komplexní pohledy extrahované z Q metody vystihnout verbálně, nejlépe ve formě rozsáhlejšího tvrzení nebo postoje nějaké fiktivní osoby. Poté, co je představen postoj této fiktivní osoby, dostanou respondenti ve výběrovém šetření prostor proto, aby tento postoj ohodnotili – zda a jak moc s ním souhlasí, zda se jim zdá postoj zdůvodněný, zda na ně fiktivní osoba působí důvěryhodně, jak často pozorují podobný postoj u lidí ve svém okolí atp. [ibid.].

  1. Postup a výsledky aplikace Q metody na studium náboženské kolektivní paměti

Náboženská kolektivní paměť a náš přístup k jejímu studiu

Ještě než podrobně popíšeme, jak jsme Q metodu přesně aplikovali, pozastavme se u zkoumaného tématu – náboženské kolektivní paměti. Použitý ilustrativní výzkum vychází z koncepce kolektivní paměti Jana Assmanna [1995; 2008]. Ten chápe paměť jako proces a rozlišuje tři typy paměti: individuální, komunikativní a kulturní, přičemž komunikativní a kulturní jsou dvě formy kolektivní paměti. Individuální pamětí Assmann chápe paměť jednotlivce, tak ji běžně rozumíme – jako neuro-psychický proces. Komunikativní paměť je již sociální proces, byť jsou jeho nositeli stále jedinci se svými představami o historii a svou autobiografickou pamětí. Avšak tyto představy a autobiografické paměti se sjednocují každodenní vzájemnou komunikací. Kulturní paměť je jako jediná formalizovaná a obvykle fixovaná ve formě literárních a výtvarných děl, zákoníků, učebnic atp., ale fixace může mít i formu tanců, her nebo rituálů. Kulturní paměť vždy vyžaduje specialisty, kteří do ní mohou ukládat a získávat z ní obsahy, zatímco s komunikativní pamětí mohou nakládat všichni. Všechny tři druhy paměti jsou dynamicky propojené individuální a komunikativní paměť se ukládají v kulturní, ale zároveň také z kulturní paměti čerpají svůj obsah; jedinec s obsahem své individuální paměti přispívá k procesu komunikativní paměti, a tento proces zároveň jeho individuální paměť formuje [ibid.]. Kolektivní paměť má mnoho nik a vrstev, jako náboženskou chápeme takovou niku, která se svými specifickými prvky odlišuje od ne-náboženských nik a vrstev. V případě české náboženské kolektivní paměti tak máme na mysli např. postavení českých svatých v české historii, vztah osobností české historie k náboženství, náboženskou interpretaci svátků, historických událostí atp.

Pro výzkum kolektivní paměti se využívají dva základní přístupy: buď se analyzují přímo objekty kulturní paměti, nebo se metodami orální historie zkoumá podoba autobiografických pamětí (srovnej [Olick et al. 2011]) – my jsme se rozhodli pro jinou cestu. Cílem našeho výzkumu bylo zmapovat, jak se náboženská kulturní paměť otiskla skrze komunikativní paměť do individuálních pamětí. Zajímalo nás, jaké základní dimenze má česká náboženská kolektivní paměť, které základní pohledy ji konstituují a jak je v tomto prostoru rozmístěná česká populace. Proto jsme prostudovali materializovanou formu komunikativní paměti – denní tisk – abychom zjistili, jaké výroky pronikly z náboženské kulturní do komunikativní paměti. Vybrané výroky jsme využili jako Q sample pro Q metodu, která nám umožnila: (1) najít základní pohledy na vztah náboženství a českých dějin, (2) identifikovat, které výroky zřetelně štěpí nalezené pohledy, a (3) přiřadit výrokům váhy, díky kterým jsme sestavili pro každý pohled Likertovu škálu. Tyto škály jsme pak využili v reprezentativním výběrovém šetření, což nám umožnilo zjistit, jak je v prostoru náboženské kolektivní paměti rozmístěná česká populace.

Stanovení Q sample a P sample

Jako concourse jsme zvolili články v celostátních denících za léta 2010-2013[1] – předpokládali jsme, že formulace v denním tisku odrážejí ustálené narativní rámce, které jsou v populaci součástí běžného povědomí o historii. Nejprve jsme vytvořili seznam událostí, míst, období, svátků a osobností. Využili jsme práci Jiřího Šubrta a Jiřího Vinopala [2013] věnovanou výsledkům rozsáhlého reprezentativního šetření historického vědomí obyvatel ČR. Převzali jsme seznamy nejčastěji zmiňovaných období, osobností, událostí a míst českých dějin.[2] Seznam jsme dále doplnili o státní a církevní svátky – nebyl nám znám žádný výzkum významu svátků, proto seznam vyšel z týmové diskuze. Během týmové diskuse jsme také seznam zkrátili na konečných 68 položek (viz Příloha č. 1). V našem concourse jsme vyhledali výroky, ve kterých se objevily položky ze seznamu, zaznamenávali jsme jak výroky, které položky interpretovali nábožensky, tak výroky bez náboženské interpretace. Přestože se ke všem položkám seznamu nepodařilo dohledat alespoň jeden výrok, vyhledáváním jsme dospěli k cca 360 výrokům. Ty bylo třeba očistit od duplicit a předběžně redukovat výroky, pokud jejich počet pro jednu položku přesáhl 12. Tímto krokem jsme získali seznam 193 výroků. Navíc jsme ověřili, že položky vynechané ze zkráceného seznamu (Příloha č. 1) nejsou v textech článků zmiňované.

Pro výběr výroků do Q sample jsme si stanovili základní kritérium: ke každé položce vybereme právě dva výroky – jeden bez jakéhokoli vztahu k náboženství a druhý naopak se vztahem k náboženství. Důvodem pro toto kritérium byla snaha odhalit, zda respondenti při hodnocení výroků o položkách reagují na náboženskou interpretaci, nebo na položku samotnou. Proto jsme usilovali o to, aby každá položka byla v prvním výroku interpretována nábožensky a zároveň ve druhém výroku bez vztahu k náboženství. U 23 položek bylo toto kritérium naplněno, našli jsme pro ně alespoň jeden výrok obou typů. Pokud bylo k dispozici několik výroků daného typu (obvykle ne-náboženského), snažili jsme se na základě týmové diskuze vybrat výrok zdůrazňující nejtypičtější vlastnost položky, ale zároveň jsme sledovali čistotu interpretace – aby byla jasně náboženská nebo nikoli. U 44 položek jsme v našem korpusu článků nenašli buď žádný výrok, nebo jsme nenašli náboženský výrok. U jediné položky seznamu – Jan Zrzavý – jsme v korpusu článků našli jen náboženský výrok. Rozhodli jsme se výrok bez vztahu k náboženství doplnit, protože v případě významné osobnosti je možné ne-náboženský výrok vytvořit poměrně bezpečně. Použili jsme variaci ne-náboženského výroku o Janu Nerudovi, výsledné znění je: „Jan Zrzavý byl významný český malíř“. Q sample tedy obsahuje 48 výroků, které se týkají 24 položek (viz Příloha 2).

Při výběru osob do našeho P sample jsme sledovali dvě charakteristiky: věk a religiozitu. Předpokládali jsme, že věk bude rozhodně ovlivňovat vztah k dějinám buď sám o sobě, nebo zde bude patrný kohortní efekt osoby které prošly stejnou podobou školního systému a osnov dějepisu, si budou ve svých pohledech na dějiny patrně podobnější, budou často sdílet i podobnou historickou zkušenost atd. Dále jsme předpokládali, že religiozita bude ovlivňovat postoj k místu náboženství v dějinách. Nábožensky založené osoby mohou pravděpodobněji vidět náboženství jako pozitivní součást dějin, osobám bez vyznání může zase častěji náboženství připadat jako negativní element dějin, případně jim častěji bude připadat vztah náboženství a dějin jako nezajímavý.

Do P sample jsme zařadili úsudkem celkem 46 osob, které pokrývali tři základní kohorty (18–25 let, 26–53 let, 54–74 let). V nejmladší kohortě jsou aktuální univerzitní studenti členů výzkumného týmu. Střední kohorta byla primárně cílena na generaci rodičů těchto studentů (ale nikoli samotné rodiče zkoumaných studentů!). Navíc jsme do této kohorty zařadili mladší osoby v produktivním věku, které už ukončily svá studia. Nejstarší kohorta byla primárně cílena na generaci prarodičů nejmladší kohorty (nikoli samotné prarodiče!) a doplnili jsme ji o osoby v postproduktivním věku. Osoby ze střední a nejstarší kohorty byly vybrány úsudkem z okruhu známých osob členů výzkumného týmu, mohli jsme tak kontrolovat rovnoměrnější zastoupení věřících a nevěřících osob. V nejmladší kohortě odpovídá religiozita věku a pohlaví participantů.

Q sort

Fáze Q sort byla provedena zcela standardně. Hlavní pokyn, dle kterého měli účastníci třídit Q sample, zněl: „Roztřiďte sadu výroků podle toho, do jaké míry vyjadřují Vaše přesvědčení. Dávejte je tím více vlevo, čím více Vašemu přesvědčení odporují, a tím více vpravo, čím více se s nimi ztotožňujete. Pozor, nejde o hodnocení správnosti – věcně správný výrok, který ve Vás nevyvolává ani ztotožnění ani odpor patří spíše doprostřed“. Každý člen P sample dostal pro svůj Q sort všech 48 vybraných výroků vytištěných na kartičkách a list formátu A3, na kterém bylo počtem prázdných polí naznačeno jak je třeba výroky roztřídit na škále
od -4 do +4. Počty vyhrazených míst pro jednotlivé stupně souhlasu vizte na Obrázku 1.

 

QMET_Obr1.jpg

oté co účastníci provedli Q sort, byly zaznamenány pozice kartiček na pomocných arších, a to včetně věku a pohlaví účastníka. Náboženství jsme nezaznamenávali – u studentů jsme očekávali, že jejich religiozita bude odpovídat jejich věku, kraji, dosaženému vzdělání a statusu, a u známých, které jsme oslovovali, nám byla religiozita známá. Všechny výstupy z Q sort byly přepsány v požadovaném formátu, jednotliví respondenti tvořili sloupce a jednotlivé výroky řádky datové matice.

Úvodní analýza dat – alternativní realizace Q metody

První analýza dat z Q sort ukázala, že v našem P sample dominují tři typy pohledu na roli náboženství v historii. První přístup viděl náboženství jako inherentní součást pohledu na historii, druhý se proti tomu ostře vymezoval a měl tendenci historii a náboženství oddělovat a konečně jsme našli třetí pohled, který vztah náboženství a historie nezajímal. Při realizaci faktorové analýzy jsme použili všechny metody odhadu, které nám umožnil statistický balík STATA 11.2. Všechny metody extrahovaly jeden velmi silný faktor a 7 až 11 sice slabších faktorů, avšak s eigenvalue vyšším než 1. Rozhodli jsme se pro tři faktory, protože třetí faktor vždy extrahoval jako poslední více než 5 % variability dat. Nepoužili jsme však základní řešení, ale rotaci oblique promax, kterou jsme volili z teoretických důvodů – jako jediná připouští, že mezi faktory může být korelace. A my se právě domníváme, že pokud někdo vnímá vztah náboženství a interpretace historie určitým způsobem, bude to souviset s jeho vztahem k ostatním pohledům na tento vztah.

Na základě faktorových zátěží jsme participanty přiřadili k jednomu ze tří extrahovaných pohledů na vztah náboženství a českých dějin. Některé jedince nebylo možné přiřadit k žádnému faktoru, protože u žádného neměli faktorovou zátěž s absolutní hodnotou nad 0,4. Poté jsme datovou matici transponovali tak, aby respondenti tvořili řádky a hodnocení výroků sloupce a zaznamenali jsme hodnotu 1 do proměnných PohledA, PohledB a PohledC, podle toho zda je pro participanta dominantní faktor A, B nebo C. Pokud pro respondenta určitý faktor nebyl dominantní, měl v příslušné proměnné uloženu hodnotu 0, respondenti bez dominantního faktoru měli ve všech třech proměnných hodnotu 0.

 

Výběr výroků a parametry výběrového šetření

Po té jsme provedli sérii 48 regresních analýz – pro hodnocení každého výroku jednu – kde bylo hodnocení výroku jako závisle proměnná a jako nezávisle proměnná byly použity identifikátory dominantních faktorů (PohledA, PohledB, PohledC). Zajímalo nás, kolik variability (R2) dokáže vysvětlit tento jednoduchý model a zda budou mít odlišné pohledy (A, B, C) výrazně odlišný názor na příslušný výrok. Výsledky regrese jsme ještě kontrolovali pomocí tabulární analýzy – zda výraznější rozdíly v regresních koeficientech doprovází také homogenní distribuce odpovědí příslušného pohledu na jednom z konců hodnotící škály.

Na základě výsledků faktorové, regresní a tabulární analýzy jsme vybrali pro reprezentativní dotazníkové šetření 12 výroků, které výrazně a spolehlivě štěpí P sample do tří skupin. Tyto výroky jsou v Příloze 2 vyznačené tučným písmem a níže je také uvádíme v Tabulce 1. Jde především o náboženské výroky (9 z 12). Výroky „Odsun Němců byla chyba“ a „Pražský hrad nemá být dotčen restitucemi“ jsme museli na základě zkušeností z Q sort pozměnit. Respondenti, kteří chtěli s výroky nesouhlasit, si nebyli jistí, jestli správně chápeme jejich nesouhlas. Proto jsme výroky přeformulovali takto: „Odsun Němců byla správná věc“ a „Pražský hrad má být součástí restitucí“.

Vybrané výroky se spolu s řídící otázkou[1] staly součástí dotazníků, které zkoumaly náboženskou paměť obyvatel ČR, k dispozici byly tři verze dotazníků. První pro základní vzorek obecné populace, druhá pro rodiče respondentů ze základního vzorku a třetí pro dospělé děti respondentů ze základního vzorku. Sběr dat probíhal ve dvou kolech. V prvním kole byly sebrány 1004 dotazníky formou CAPI.[2] Sběr byl zaměřen na obecnou dospělou populaci České republiky. Jednalo se o stratifikovaný náhodný výběr s oporou adres z Registru sčítacích obvodů ČSÚ, přičemž Česká republika byla rozdělená do 57 vzájemně disjunktních strat definovaných na základě kombinace kraje a velikosti obce. Z těchto strat byly náhodně vybrány základní sídelní jednotky, z nich domácnosti a nakonec byli náhodně určeni konkrétní respondenti. Druhé kolo mělo za cíl zkompletovat data o dvojicích rodič-dítě, proto se zaměřovalo na dospělé děti nebo na rodiče respondentů z prvního kola. Dotázáno bylo 311 osob opět formou CAPI. Vzhledem k nízkému počtu kontaktů získaných od respondentů v prvním kole byly ve druhém kole osloveny téměř všechny kontakty. Od každého respondenta z prvního kola byl osloven alespoň jeden kontakt. Pokud respondent v prvním kole uvedl více kontaktů, byly kontakty osloveny v náhodném pořadí a pokud byl s některým z kontaktů provedený rozhovor, další kontakty v pořadí již osloveny nebyly.

Revize úvodní analýzy – klasické provedení Q metody

Po sebrání dat se vyskytl problém: jak určit váhu jednotlivých výroků pro studované pohledy. Kombinace faktorové a regresní analýzy popsaná výše byla poměrně bezpečná, pochopitelná a postačovala k výběru výroků, ale není možné na jejím základě stanovit váhy jednotlivých výroků pro konstrukci Likertových škál. Rozhodli jsme se tedy celou analýzu sebraných Q sortů provést znovu, tentokrát klasickým nikoli alternativním způsobem. Zároveň jsme testovali předpoklad, který je ve všech textech o Q metodě uváděn: že je Q metoda robustní vůči porušené reprezentativitě vzorku. Náš P sample totiž obsahoval 23 žen do 25 let. Tvořily tedy polovinu vzorku – mělo by jich však být 5, aby jejich počet proporčně odpovídal počtu mužů do 25 let a proporcím ostatních kohort.

Z našeho P sample jsme náhodně vygenerovali 30 vzorků, a to tak, že jsme vždy náhodně vybrali, kterých 5 studentek v P sample zůstane a kterých 18 z daného vzorku vyloučíme. Na každém z 30 vzorků jsme provedli patřičnou analýzu (popis viz níže) pomocí software PQMethod 2.35 [Schmolck 2014]. Výsledky všech 30 analýz jsme pak sloučili do jediného souboru a s pomocí STATA jsme ověřili stabilitu výsledků, kvalitu výběru výroků podle předchozí alternativní metodiky a stabilitu stanovených vah (popis viz v další podkapitole).

V PQMethod jsme provedli faktorovou analýzu metodou centroidů a také jsme si ověřili, že ideální počet extrahovaných faktorů jsou dva. V software STATA jsme si ověřili, že i v něm po výše popsané redukci P sample dospějeme k řešení se dvěma pohledy. To znamená, že počet faktorů v našem případě nezávisí na použitém software a také že Q metoda není robustní vůči výrazně vychýlené reprezentativitě P sample. Řešení se třemi pohledy tedy opouštíme a dále se budeme v textu – až na jedinou výjimku – zabývat pouze řešením s dvěma faktory. Tou zmíněnou výjimkou je pozdější pasáž textu, ve které srovnáme, jaké výroky jsme vybrali pro dotazníkové šetření na základě našeho alternativního řešení se třemi pohledy a jaké bychom vybrali klasickým postupem Q metody.

Dva extrahované faktory jsme potom v software PQMethod rotovali ručně. Rotace pomocí statistických algoritmů se obvykle snaží o rovnoměrnější rozdělení faktorových zátěží. My jsme však sledovali jiný cíl – rotovat pozorování tak, aby faktor č. 1 pozorování co nejvíce diverzifikoval, tj. aby byla pozorování rozprostřena po co největší délce osy faktoru. Pozorování byla vždy mezi faktory rozprostřena tak, že jejich útvar měl přibližně doutníkový tvar. Pootočili jsme pak faktory tak, aby osa doutníku byla přibližně rovnoběžná s osou faktoru č. 1. Výsledky rotace jsme uložili a nechali automaticky označit, které Q sorty jsou pro oba faktory typické. Počítali jsme s tím, že jedné osobě mohou být blízké či odporné oba dva pohledy na vztah náboženství a historie. Proto jsme pro výpočet vah použili jeden Q sort pro oba faktory, pokud skóre bylo v obou případech vysoké (absolutní hodnota 0,4 a vyšší).[3] Naším cílem bylo stanovit váhy pro výroky vybrané do reprezentativního šetření. Proto jsme dbali, aby se v případě dvou vysokých zátěží osoba objevila u obou faktorů. Z takto připravených dat PQMethod vypočítal váhy jednotlivých výroků.

Sestrojení vlastního měřícího nástroje

Váhy získané z PQMethod, jsme uložili do STATA, kde jsme je dále zpracovali. Tyto váhy jsou ve výstupu PQMethod označovány jako z-scores a jejich hodnoty se v našem případě pohybovaly od téměř +3 až po téměř -3.[4] Q metoda obvykle s těmito váhami pracuje tak, že výroky podle z-scores pro každý pohled seřadí od nejvyššího po nejnižší a pak výrokům přidělí váhu podle rozsahu a tvaru pseudo-normálního rozdělení použitého pro Q sort. V našem případě by to byly váhy od +4 po -4 přidělené dle Obrázku 1 (viz výše).

My jsme tento postup nevyužili, a to z následujícího důvodu – chtěli jsme odhalit strukturu vztahů mezi výroky a to, jak společně vytváří celistvou škálu. Přiřazení přesného počtu vah určité velikosti má v Q metodě své opodstatnění, ale pro náš účel vhodné není. Máme-li např. čtyři výroky s nejvyššími z-skóry +2,84, +2,71, +1,87 a +1,83, přidělí v našem případě prvním třem klasický postup stejnou váhu +4, přestože mezi druhým a třetím výrokem je rozdíl 0,84, a čtvrtý výrok má o čtvrtinu nižší váhu, tedy +3, přestože je mezi ním a třetím výrokem rozdíl 0,04. Navíc, váhy výroků od +4 po -4 jsou zbytečně vysoké, pro naše účely zcela postačí váhy ve spojitém intervalu od -1 do +1.

Abychom vyřešili oba tyto problémy, velikosti z-skórů jsme standardizovali na škále -1/+1 pro každý faktor v každé z 30 analýz provedené pomocí PQMethod. Získali jsme tak pro každý pohled 30 sad vah pro všech 48 výroků. Pro konstrukci škály měřící u respondenta přítomnost daného pohledu jsme pak použili průměrné váhy příslušných výroků. Do jaké míry byly jednotlivé výsledky stabilní, ukazuje Obrázek č. 2 (viz v následující podkapitole níže) – čím je příslušný boxplot delší a čím delší jsou jeho vousy, tím je větší rozptyl hodnot a průměrná váha je méně spolehlivá. Průměrné váhy, které byly použity ke konstrukci škál, jsou v Tabulce č. 1.

QMET_Tab1.jpg

Můžeme si všimnout, že u pohledu A převažují negativní váhy – tento pohled tedy reprezentuje odmítání, v tomto případě restitucí Pražského Hradu a silného spojení Vánoc a Nového Roku s Kristem a matkou Boží. Pohled B pouze výrazně odmítá interpretaci Klementa Gottwalda jako přátelsky naladěného vůči církvi, ale jinak zde dominují spíše pozitivní váhy. Např. interpretace Masaryka jako duchovní osobnosti, duchovní interpretace Vánoc a připomenutí Jana Nepomuckého.

Můžeme si také všimnout, že mezi váhami nenajdeme žádnou o velikosti přesně -1 či +1. V případě výroku 27 (duchovní interpretace Vánoc) to je tím, že nešlo o minimum ve všech 30 analýzách, v některých byl tento výrok jen předposlední, pročež průměr vychází -0,98. Ale to, že u druhého pohledu chybí minimum a u obou maxima, je dáno něčím jiným. Rozhodli jsme se provést standardizaci v rámci jednotlivých analýz jako celků, nikoli pouze mezi 12 vybranými výroky. A protože již víme, že nebyly vybrány výroky, které byly pozitivními extrémy obou škál, logicky pak nemůžeme nalézt hodnoty těsně atakující +1. Rozhodnutí standardizovat váhy v rámci všech 48 výroků a ne jen mezi vybranými 12 výroky jsme učinili právě proto, že mezi 12 vybranými výroky pozitivní maxima mají k +1 mnohem dál, než negativní maxima k -1. Při standardizaci v rámci vybrané sady výroků tak hrozilo, že některé váhy blízké 0, se stanou slabě či silněji pozitivní, také že některé negativní váhy se přiblíží 0, a tím vším se tak zcela vytratí původní váha, kterou výroku přiřkl P sample.

Jak je uvedeno v poznámce u Tabulky č. 1, pro finální škály nebyly využity 3 výroky. Tyto tři výroky jako jediné nepropojují historii s náboženstvím. Analýzy však ukázaly, že propojení historie s náboženstvím je pro odlišení obou pohledů klíčové. Proto dále stavíme jen na 9 náboženských výrocích, zahrnujeme i ty s nízkou vahou. Naším úkolem a cílem je odhalit klíčové body v kolektivní náboženské paměti české populace, nikoli body v celé kolektivní paměti, proto ne-náboženským výrokům nemůžeme věnovat stejnou pozornost. Ne-náboženské výroky jsou však důležité – pomáhají vymezit místo náboženských výroků, zda jsou přijatelné, či nikoli a tak je díky ne-náboženským výrokům mnohem lépe určená váha těch náboženských.

Srovnání výsledků alternativního a klasického provedení Q metody

Srovnání výsledků původní analýzy[1] a výsledků opakované analýzy 30 náhodně redukovaných P samples přinesla dvě překvapení. Za prvé, původní analýza, která nebyla robustní vůči nadreprezentaci mladých žen, předpovídala tři pohledy na roli náboženství v českých dějinách, nová analýza nalezla jen dva pohledy – vytratil se třetí pohled, který vztah náboženství a dějin ignoruje. Mladé ženy tvořily polovinu našeho P sample, byl mezi nimi zřejmě dostatek těch, které vztah náboženství a dějin ignorovaly, a proto se třetí pohled jevil jako dostatečně zastoupený. Když jsme počet mladých žen v P sample náhodně redukovali na odpovídající podíl, tak se zástupci ignorujícího pohledu přiřadili k jednomu ze dvou nalezených pohledů, které přetrvaly navzdory náhodné redukci P sample, případně se umístili v neutrálním středu škál obou pohledů.

Za druhé, překvapivé je také to, že výsledky potvrdily původní volbu výroků – pokud bychom místo původní kombinace faktorové a regresní analýzy důsledně uplatnili Q metodu, dospěli bychom k přibližně stejné sadě výroků vybrané pro dotazníkové šetření. Intuitivně bychom možná čekali, že změna v počtu nalezených pohledů by se měla projevit i ve volbě výroků, které mají mezi zástupci jednotlivých pohledů rozlišovat. Pouze jediný výrok – týkající se K. H. Borovského – měl váhy pro obě škály blízké 0. A oba výroky týkající se Bílé Hory měly váhy pro obě škály do 0,35. Všech 9 zbylých vybraných výroků mělo alespoň jednu váhu kolem 0,5 nebo vyšší.

Ukázalo se, že alternativním postupem (viz výše), jsme nevybrali všechny výroky s nejextrémnější vahou, tj. reprezentující extrémní konce škály. Ale opět se ukázalo, že to nebylo na škodu – tyto výroky obvykle často reprezentovaly extrém obou škál, resp. pohledů. Především to platilo o pozitivním konci škály, jak je vidět na Obrázku č. 2. Pokud některý výrok reprezentoval pozitivní konec škály A, zároveň velmi pravděpodobně dobře reprezentoval pozitivní konec škály B. Tím pádem takový výrok dobře nerozlišoval mezi pohledy. Zařazení takových výroků do reprezentativního šetření se nedoporučuje a náš přístup nás toho dokázal vyvarovat (krom tří případů, které jsme diskutovali výše). Na Obrázku č. 2 je také vidět, že výrazné odlišnosti jsou na negativních koncích škály. A pokud jsou tyto odlišnosti i spolehlivé, většinou se nám takové výroky pomocí naší metodiky (viz výše) podařilo vybrat.

QMET_Obr2.jpg

Výsledky měření pomocí zkonstruovaných škál

Analýza dat z Q sort ukázala, že v našem P sample dominují dva typy pohledů na roli náboženství v historii. První pohled nazýváme separatistický [A], protože je charakteristický tím, že historii a náboženství aktivně odděluje a ostře se vymezuje proti tendenci historii a náboženství propojovat. Druhý pohled nazýváme spirituální [B], protože vnímá náboženství jako přirozenou součást pohledu na historii – neodmítá duchovní interpretaci událostí, osobností, míst a svátků a v některých vybraných případech tuto interpretaci přímo podporuje.

Díky analýze dat z Q sort máme k dispozici váhy, díky kterým jsme mohli zkonstruovat pro každý ze dvou výše uvedených pohledů Likertovu škálu. Jako nejlepší řešení se ukázaly Likertovy škály, které byly založené na 9 výrocích prezentujících náboženský pohled. Tedy, vynásobili jsme váhou stupeň ne/souhlasu s výrokem a výsledky sečetli, pro každého respondenta z reprezentativního souboru tak máme dva číselné údaje. První nám říká, jak moc je respondentovi blízký separatistický pohled [A], a druhý, jak moc je mu blízký spirituální pohled [B]. Výsledek vidíme na Obrázku č. 3.

 

QMET_Obr3.jpg

Naše základní zjištění je, že se religiozita odráží při interpretaci národní historie – nejen v našem P sample, ale i reprezentativním vzorku české populace jsou přítomné dva pohledy na vztah náboženství a historie: separatistický [A] a spirituální [B]. V obou fázích výzkumu jsme použili tvrzení jak nábožensky zabarvená, tak tvrzení prostá náboženské interpretace. Pokud by v první fázi výzkumu nikomu ze 46 respondentů našeho P sample nevadil nebo nevyjadřoval vlastní hluboké přesvědčení žádný nábožensky zabarvený výrok, škály by se vůbec nepodařilo sestavit. Váhy všech nábožensky zabarvených položek by byly blízké 0, žádná by se ani nepřiblížila -1/+1 – tak tomu ale není, respondenti na nábožensky zabarvené položky reagovali a váha některých z nich se přiblížila +1 a především -1 (viz Tabulku č. 1 výše).

Na Obrázku č. 3 zase vidíme, že reakce na výroky nebyla pouze záležitostí P sample – také ve vzorku české populace jsme zaznamenali odmítavé a souhlasné reakce vůči nábožensky zabarveným výrokům. Obě škály jsou založené pouze na nábožensky zabarvených výrocích, pokud by se respondentů nedotýkaly a respondenti by jim tak dávali neutrální odpovědi 0 místo kladných či záporných hodnocení, oba grafy by se zmenšily na úzkou oblast kolem bodu 0. Tak tomu ale není, v obou případech se prostřední polovina souboru rozprostřela v úseku minimálně 5 bodů (symbolizuje to box uprostřed) a dolní a horní čtvrtina se napínají směrem k minimu a maximu škály. Z toho všeho můžeme usoudit, že česká populace na nábožensky zabarvené výroky reaguje a že paleta jejích reakcí je pestrá – my jsme tyto reakce sjednotili do dvou škál, které prezentujeme výše (Obrázek č. 3).

Diskuse relativní povahy výsledků

Jelikož jsou sestrojené škály relativní měřící nástroje, jsme schopni jen omezeně vypovídat o české populaci jako celku. Na základě škál zkonstruovaných pomocí Q metody, nemůžeme přinést jeden agregovaný údaj, který by něco vypovídal o populaci jako celku. Nemůžeme říct, zda česká populace preferuje více spirituální pohled [B], nebo separatistický pohled [A]. Jedinou výjimkou jsou míry popisující diverzitu a distribuci populace na použitých škálách (vyz výše komentáře Obrázku č. 3), ale tyto údaje jsou vlastně založené na relacích mezi jednotlivými pozorováními.

 

QMET_Obr4.jpg

Relativní podstatu Q metody (a také nástrojů konstruovaných s její pomocí) je třeba brát v potaz při plánování výzkumu. První možností je aplikovat tento přístup na problém, který je svou povahou relativní (srovnání různých podskupin, srovnání populačního ukazatele před a po zamýšlené intervenci atd.). Tento přístup můžeme ilustrovat na Obrázku č. 4, kde lze sledovat generační vývoj kolektivní náboženské paměti, srovnáváme tedy skupinu rodičů se skupinou jejich dětí. V levé části Obrázku č. 4 vidíme, že pohled [A] velmi mírně posiluje (první a druhý boxplot). Změna je však velmi volatilní (třetí boxplot) – některé děti se ve srovnání s rodiči k tomuto pohledu velmi silně přiklonili, jiné se od něj zase velmi silně odklonili. Byť je tedy čistá mezigenerační změna velmi mírná (nárůst o 0,70 bodu), hrubá změna na úrovni jednotlivých párů je masivní (průměrný posun na jeden pár je 3,35 bodu). Pohled [B] naopak oslabuje (čtvrtý a pátý boxplot), dokonce je toto oslabení (1,03 bodu) o něco větší než posílení separatistického pohledu [A]. Změna je ale méně volatilní (třetí a šestý boxplot) – z grafu je vidět, že v případě změn u spirituálního pohledu [B] je rozpětí extrémních změn menší, také rozpětí mezi prvním a třetím kvartilem je menší (pohled [A] 5,0 bodu, pohled [B] 3,9 bodu). Můžeme tedy říci, že čistá změna vývoje české náboženské kolektivní paměti je mírná, doprovází ji však výrazná hrubá změna. Mírně posiluje separatistický pohled [A], u kterého je i mírnější čistá změna, a oslabuje spirituální pohled [B], u kterého je i slabší hrubá změna.

Druhou možností jak reagovat na relativní povahu Q metody je pomocí jiných metod kalibrovat naše relativní měřící nástroje. Kalibraci příhodně ilustruje článek Havlíkové [2016], jehož metodologické pozadí jsme popsali výše v pasáži věnované srovnání měření pomocí Q sort a klasických škál. Pomocí klasického postupu Havlíková zjistila, že obyvatelé Karlových Varů vidí ve zdejším filmovém festivalu více méně příčinu všech 23 hodnocených jevů. Pokud bychom tedy na základě Q metody sestrojili vlastní nástroj pro měření dopadu Karlovarského festivalu, víme, že jako celek je posunutý směrem k rozhodnému souhlasu, protože respondenti mají tendenci s každou položkou v průměru souhlasit. Pokud bychom nástroj přenesli do jiného prostředí, je samozřejmě nutné jej znovu kalibrovat paralelním provedením klasického hodnocení položek. Ostatně, opakovaná kalibrace by byla vhodná i v případě opakovaného měření dopadu Karlovarského festivalu – tendence obyvatel s každou položkou v průměru souhlasit se může v čase měnit.

  1. Rozvaha ke zkušenostem s konstrukcí měřící škály pomocí Q metody pro výběrové šetření

Ve článku byla stručně představena Q metoda – způsob zkoumání subjektivity cílové populace. Bylo také demonstrováno, jak lze prakticky výstupy z Q metody uplatnit v dotazníkovém šetření – jak vybrat vhodné baterie výroků, jak z nich sestavit škály a jak jim připsat odpovídající váhy. Z naší praktické demonstrace vyplývají tři poučení. Zaprvé, Likertovy škály sestrojené díky Q metodě jsou relativní měřící nástroje – jsou schopné zachytit relativní postavení respondentů vůči sobě navzájem a jejich postoje vůči použitým výrokům. Navíc víme jakým směrem je sestrojená škála orientovaná. Nevíme ale, jaké absolutní hodnotě odpovídá střed škály sestrojené výše popsaným způsobem. Vzhledem k relativní povaze jsou takové měřící nástroje užitečné tam, kde chceme srovnávat. Má smysl uvažovat o třech srovnáních: (a) srovnání různých podskupin z hlediska agregovaných ukazatelů (např. průměrné skóre),
kterého dosáhly na jednotlivých škálách, (b) srovnání rozdílů dvojic pokud máme párová data např. nadřízený – podřízený, dítě – rodič, partneři atd., (c) srovnání v čase: sledování vývoje agregovaných ukazatelů cílové populace nebo jejích podskupin pomocí opakovaných průřezových šetření, individuální vývoj pak můžeme sledovat pomocí individuálních dat z panelového šetření.

Zadruhé, ani při aplikaci Q metody nesmíme podceňovat reprezentativitu P sample. Jako ideální se nám jeví proporčně vyrovnané zastoupení dotčených skupin – je dobré, když každou podskupinu cílové populace ve vzorku reprezentuje přibližně shodný počet respondentů. V našem příkladu výrazné problémy způsobila výrazná nadreprezentace jedné ze šesti skupin daných kombinací věku a pohlaví. Ukázali jsme, že i tento problém je řešitelný pomocí náhodné redukce nadreprezentované podskupiny na odpovídající velikost. Není to však ideální řešení, neboť neúměrně zvyšuje náročnost zpracování – náhodnou redukci je třeba provést opakovaně a pro každou verzi redukovaného vzorku je třeba provést analýzu (v našem příkladu jsme ji provedli 30 krát).

Zatřetí, je vhodné se držet osvědčeného postupu Q metody a používat k němu prověřený software (zde to byl freeware PQMethod 2.35). Ukázali jsme, že je možné provést pomocí běžného statistického balíku (zde STATA) kombinaci faktorové analýzy a regrese. Toto alternativní řešení bylo poměrně rychlé (nevyžadovalo zvládnutí nového software) a poměrně spolehlivě nám pomohlo vybrat výroky, které štěpily P sample a potažmo i cílovou populaci. Bez pomoci PQMethod jsme však nedokázali stanovit váhy výroků pro sestrojení škál. Investovat čas a energii do zvládnutí PQMethod či podobného software se nám nyní jeví jako nezbytné, jelikož Q metodu v kombinaci s dotazníkovým šetřením využíváme právě proto, abychom vybrali pro dotazník vhodnou baterii výroků a zkonstruovali z nich škálu.

 Možnosti Q metody jsou mnohem širší, než jak bylo demonstrováno na příkladu kolektivní náboženské paměti. Nabízí se provádět se členy cílové populace rozhovory nebo focus groups před samotnou aplikací Q metody, pak je z nich možné extrahovat tvrzení, která použijeme v Q metodě. Výpovědi participantů tak vytvoří specifický concourse. Je také možné místo průřezového šetření pro evaluaci využít panelové šetření, nebo opakované průřezové šetření. Před zavedením intervence bychom sebrali concourse a z něj vybrali Q sample, extrahovali typy subjektivit a sestavili baterie a škály. Tyto škály pak můžeme aplikovat v dotazováních, které proběhnou před a po intervenci. Případně můžeme i po intervenci ještě celou Q metodu znovu zopakovat, abychom se ujistili, že intervence nezpůsobila vznik nových typů subjektivit, a že tudíž můžeme použít před i po intervenci stejné baterie výroků.


 

Poděkování:

Všem kolegům z projektu „Kontinuita a diskontinuity v náboženské paměti v České republice“ za podnětné diskuse nad přípravou Q sample a spolupráci při realizaci Q metody a výběrového šetření. Děkuji také dvěma anonymním recenzentům, jejichž připomínky pomohly zlepšit výslednou podobu textu.

Literatura

[1]        ASSMANN, J. 1995. „Colective Memory and Cultural Identity“. New German Critique 65: 125–133.

[2]        ASSMANN, J. 2008. „Communicative and Cultural Memory“. Pp.
109–118 in: Astrid Erll, Ansgar Nünning (eds.). Media and Cultural Memory. Berlin – New York: Walter de Gruyter.

[3]        COMREY, A. L., HOWARD B. L. 2013. A First Course in Factor Analysis. New York: Psychology Press.

[4]        DANIELSON, S. 2009. „Q Method and Surveys: Three Ways to Combine Q and R.“ Field Methods 21(3): 219–237.

[5]        DAVIS, Ch. H., CAROLYN M. 2011. „Q Methodology in Audience Research: Bridging the Qualitative/Quantitative ‘Divide’?“. Participations 8(2): 559–593.

[6]        DOSTÁL, J. 2015. „The Draft of The Competencial Model of the Teacher in the Context of the Inquiry-Based Instruction“. Procedia – Social and Behavioral Sciences 186: 998–1006.

[7]        HA, Eun-Ho. 2017. „How Clinical Nurses in South Korea Perceive the Status of the Nursing Profession: A Q-Methodological Approach“. International Journal of Nursing Practice 23(2): 1–8.

[8]        HAVLÍKOVÁ, M. 2016. „Likert Scale Versus Q-Table Measures – A Comparison of Host Community Perceptions of a Film Festival“. Scandinavian Journal of Hospitality and Tourism 16(2): 196–207.

[9]        HOMOLOVÁ, K. 2007. „Čtenářství v systému hodnot a norem pubescenta“. e-Pedagogium 7(2): 36–51.

[10]      HONZÍKOVÁ, J, JANOVEC, J. 2012. „Problematika osvojování psychomotorických dovedností“. Časopis pro technickou a informační výchovu 4(1): 34–39.

[11]      JEŘÁBEK, H. 2003. „Měření názorového vůdcovství v českých sociologických výzkumech“. Sociologický časopis 39(5): 687–706.

[12]      KATOMERO, J., HOPPE, R., WESSELINK, A. 2017. „Tales of Accountability: A Q-Method Study of Discourses amongst Tanzanian Members of Parliament“. Journal of Modern African Studies 55(3): 423–453.

[13]      KENNEDY, B. A. 2013. „Sorting Through: The Role of Representation in Bureaucracy“. Journal of Public Administration Research and Theory 23(4): 791–816.

[14]      KROPÁČOVÁ, J. 2005. „Výuka žáka s odlišným mateřským jazykem“.
e-Pedagogium 5(2): 42–54.

[15]      KUBRICKÝ, J., ČÁSTKOVÁ, P. 2015. „Teacher’s Competences for the Use of Web Pages in Teaching as a Part of Technical Education Teacher’s ICT Competences“. Procedia – Social and Behavioral Sciences 174: 3236–3242.

[16]      LOGO, E. 2013. „Q-method Based Environmental Awareness Measurement in Transportation“. International Journal for Traffic and Transportation Engeneering 3(1): 45–55.

[17]      MATOŠKOVÁ, J., GARCZARZOVÁ, L., KOVÁŘÍK, M. 2016. „Použití Q metodologie při tvorbě nástroje pro měření tacitních znalostí vysokoškolských studentů“. e-Pedagogium 16(1): 14–27.

[18]      MCKEOWN, B., THOMAS, D. 2013. Q Methodology. 2nd ed. Newbury Park: Sage.

[19]      MOKRÝ, S., DUFEK, O. 2014. „Q Method and Its Use for Segmentation in Tourism“. Procedia – Economics and Finance 12: 445–452.

[20]      NAVRÁTIL, J., PÍCHA, K., KNOTEK, J., KUČERA, T., NAVRÁTILOVÁ, J., RAJCHARD, J. 2013. „Comparison of Attractiveness of Tourist Sites for Ecotourism and Mass Tourism: The Case of Waters in Mountainous Protected Area“. Tourismos 8(1): 35–51.

[21]      NEKOLA, M. 2012. „Pragmatists, Prohibitionists and Preventionists in Czech Drug Policy.“ Central European Journal of Public Policy 6(2): 56–83.

[22]      OLICK, J. K., VINITZKY-SEROUSSI, V., LEVY, D. (eds.). 2011. The Collective Memory Reader. Oxford: Oxford University Press.

[23]      SCHMOLCK, P. 2014. PQ Method for Windows, Ver 2.35. (software). [on-line] http://schmolck.userweb.mwn.de/qmethod/downpqwin.htm (cit. dne 17. 8. 2017).

[24]      STEPHENSON, W. 1935a. “Technique of Factor Analysis.” Nature 136: 297.

[25]      STEPHENSON, W. 1935b. “Correlating Persons instead of Tests.” Character and Personality 4(1): 17–24.

[26]      STEPHENSON, W. 1936a. “The Inverted Factor Technique.” British Journal of Psychology 26(4): 344–361.

[27]      STEPHENSON, W. 1936b. “Introduction to Inverted Factor Analysis, with Applications to Studies in Orexis.” Journal of Educational Psychology 27(5): 353–367.

[28]      STEPHENSON, W. 1936c. “Foundations of Psychometry: Four Factor Systems.” Psychometrika 1(3): 195–209.

[29]      ŠUBRT, J., VINOPAL, J. a kolektiv. 2013. Historické vědomí obyvatel České republiky perspektivou sociologického výzkumu. Praha: Karolinum.

[30]      VALA, J. 2014. „Age Variable Student’s Personal Characteristics and Their Reader’s preferences“. Procedia – Social and Behavioral Sciences 112: 270–276.

[31]      WOUTERS, S., VAN EXEL, J., BAKER, R., BROUWER, W. B. F. 2017. „Priority to End of Life Treatments? Views of the Public in the Netherlands“. Value in Health 20(1): 107–117.

[32]      ZAGATA, L. 2010. „How Organic Farmers View Their Own Practice: Results from Czech Republic“. Agriculture and Human Values 27(3):
277–290.

[1] Již v roce 2014 jsme zakoupili od společnosti AnoPress databázi 115 841 článku z let 1996-2013, které vyšly v celostátních denících a které se nějakým způsobem týkaly náboženství, tj. obsahovaly jedno z klíčových slov: církev, církevní, křesťanství, křesťané, křesťanský, religiozita, religiózní, sekta, sekty, sektářský, budhismus, budhista, hinduismus, hinduista, islám, muslim, judaismus, sakrální, posvátný, profánní, věřící, ateismus, ateista a bezvěrec. Vybírali jsme však pouze ze článků, které vyšly v létech 2010-2013, aby zkoumaný concourse byl co nejsoučasnější.

[2] Seznam jsme ještě doplnili o české osobnosti uvedené na stránce http://www.czech.cz/cz/
66365-osobnosti-ceske-historie
(cit. dne 17. 8. 2017).

[1] Kombinace faktorové a regresní analýzy na plném P sample se 46 participanty.

[1] Řídící otázka, která uváděla hodnocení celé baterie výroků, pak zněla: „Nyní Vám přečtu 12 výroků o postavách, událostech, svátcích a místech spjatých s českými dějinami. U každého mi prosím řekněte, jak moc vyjadřuje Vaše přesvědčení, nebo jak moc Vašemu přesvědčení odporuje. Pokud se s výrokem maximálně ztotožňujete, dejte mu +4 body, pokud se s ním ztotožňujete, ale slaběji, dejte mu méně kladných bodů. Pokud výrok Vašemu přesvědčení maximálně odporuje, dejte mu -4 body. Pokud Vašemu přesvědčení odporuje, ale slaběji, dejte mu méně záporných bodů. Pokud ve Vás výrok nic nevyvolává, dejte mu 0 bodů.”

[2] CAPI je zkratka pro anglické spojení computer assisted personal interviewing, jde o osobní dotazování s podporou počítače. V našem případě poskytoval tazatelům podporu tablet, na kterém vyplňovali připravené dotazníky. Tablet kontroloval platnost filtrů, umožnil znáhodnit pořadí položek u vybraných baterií otázek, zobrazil podpůrné karty pro respondenty atp.

[3] PQMethod automaticky přiřazuje jeden Q sort k právě jednomu faktoru na základě vyšší absolutní hodnoty zátěže.

[4] Pozor! Tento údaj je velmi přibližný, týká se pouze našeho výzkumu a uvádíme jej pouze pro přibližnou čtenářovu představu, v jakém prostoru hodnot se přibližně nacházely námi nalezené hodnoty. PQMethod z-scores rozhodně neumisťuje na arbitrárně stanovenou škálu -3/+3.


Novinky

5. 4. 2016
Evaltep a ERIH Plus
3. 3. 2016
Speciální anglické vydání
18. 12. 2015
Podzimní číslo roku 2015

archív

Kontakt

Redakce ETP
Sokolovská 351/25,
186 00 Praha 8
220 190 597

Časopis Evaluační teorie a praxe je součástí:

ERIH PLUS