Obsah
6. Výkonové a osobnostní testy
Téma má přidělen: — Martin Malec 2014/01/02 17:02
Prohlašuji za hotové, pokud při učení narazíte že tam něco chybí nenechávejte si to pro sebe, aktualizujte stránku sami a dejte nám ostatním nějak vědět:))
Oficiální obsah tématu
Přehled výkonových testů a osobnostních dotazníků užívaných pro diagnostiku schopností, dovedností a osobnostních charakteristik za účelem personálního výběru. Možnosti a limity testování. Omezení sebeposuzovacích metod. Psychologické aspekty online testování. Predikování pracovního chování na základě výsledků testů. Prediktivní validita a reliabilita testů užívaných při výběru pracovníků.
Empirická studie
U tohoto tématu student/-ka představí odbornou empirickou studii zjišťující prediktivní validitu vybraného výkonového testu nebo osobnostního dotazníku při predikování pracovní výkonnosti. Bude umět do hloubky uvažovat nad příčinami zjištěné souvislosti mezi výsledkem v daném testu/dotazníku a mezi skutečnou pracovní výkonností.
Povinná literatura
- Furnham, A., & Chamorro-Premuzic, T. (2010). The Psychology of Personnel Selection. New York: Cambridge University Press (strany 102 – 157, 170 – 174).
- Leary, M. R. & Hoyle, R. H. (2009). Handbook of Individual Differences in Social Behavior. New York: The Guilford Press (strany 36 – 39, 49 – 52, 135 – 137, 259 – 266, 371 – 375).
- Svoboda, M., Humpolíček, P. & Šnorek V. (2013). Psychodiagnostika dospělých. Praha: Portál (strany 21 – 34 a vybrané kapitoly o výkonových a osobnostních testech užívaných za účelem personálního výběru).
download: vykonove_a_osobnostni_testy
Doporučená literatura
Manuály vybraných výkonových testů a osobnostních dotazníků užívaných za účelem personálního výběru, např.
- Test struktury inteligence
- Test pozornosti d2
- Dotazník interpersonální diagnózy ICL
- Dotazník motivace k výkonu LMI (Svoboda, str.429+)
- aj.
Zpracování tématu
Přehled výkonových testů a osobnostních dotazníků užívaných pro diagnostiku schopností, dovedností a osobnostních charakteristik za účelem personálního výběru.
Neopisuju tady jak přesně ty testy vypadají, od toho je předmět psychodiagnostika, a všechno z toho je ve Svobodovi.
Využití psychometriky jako takové je Evropě až na výjimky poměrně málo časté, liší se hodně v jednotlivých zemích:
Výkonové testy
testy inteligence
- WAIS-III, WAIS-IV (Wechslerovy testy, 1997, 2008)
- IST-2000R - Test struktury inteligence (Amthauer)
- WJ III/WJ-IE (Woodcock-Johnson 1977-2001)
testy schopností
Málokdy testy schopností predikují víc než z 30 % skutečný rozptyl v prac.výkonu. (Schmidt & Hunter, 1998)
- paměťové testy (Wechsler,…)
- škály potenciálu pro práci se zákazníkem (SKASUK)
Osobnostní dotazníky
Pracovní motivace
- LMI Dotazník motivace k výkonu (Schuler, Prochaska) (Testcentrum 2003): „osobnostní dotazník, určený k měření obecně pojatého konceptu motivace k výkonu v profesním kontextu“. Motivace k výkonu = podíl osobnosti na vlastní výkonnosti. 14 škál, 170 položek, 7stupňová Likertova škála. České normy 2011. Škály: Nebojácnost (nejvíc odpovídá nízkému Neuroticismu v Big5), Flexibilita, Samostatnost, Preference obtížnosti, Důvěra v úspěch, Dominance, Cílevědomost, Ochota učit se, Soutěživost, Kompenzační úsilí, Angažovanost, Hrdost (na výkon), Orientace na status, Flow, Internalita, Vytrvalost, Sebekontrola (tyto dvě poslední odpovídají Svědomitosti u Big5). Popisy škál.
- Svoboda, str.429+
- vhodný pro výběrová řízení, v rámci personálního rozvoje, při volbě povolání.. podle manuálu je potřeba odpovědět na případné otázky probandů. Nepředpokládá se ale zpětná vazba klienta
Big 5 / NEO
(Svoboda str. 418+)
Vychází z teorie stabilnějších osobnostních rysů. Výzkum osobnosti řeší hlavně jaké osobnostní rysy mají být měřeny. Opakovaně se došlo k několik základním, které známe v různých obměnách „Big 5“ (pojem od GOldberga). Byť má Big5 i své odpůrce, je při zkoumání osobnosti kánonem, základem.
- NEO pětifaktorový osobnostní inventář (Testcentrum 2001) 60 položek vychází z NEO-FFI
- NEO osobnostní inventář podle NEO-PI-R (Testcentrum 2004) normy na českou populaci!
- Costa, McCrae - NEO-PI (personality inventory) 1985, NEO-PI-R, NEO-FFI (five factor inventory) 1992
Jiné konstrukty lze často zařadit do těch pěti základních kategorií:
Podle Hogana (1996) nevykazují osobnostní inventáře systematické zkreslení u jiných etnických a národnostních skupin, či tělesně hendikepovaných. Jejich spojení s inteligenčním testem ale neodstraňuje „negativní dopad“ (adverse impact) vyplývající z „3krát g“ (viz níže).
NEO / jiné BIG-5 - poskytuje pracovním psychologům a výzkumníkům univerzální jazyk pro porovnání mezi případy, studiemi ap. Prediktivní síla Big 5:
Nejdůležitějším faktorem je svědomitost, která je nejsilnějším prediktorem hned po IQ, zahrnuje spoustu věcí:
- IQ (GMA) říká co lidi „mohou zvládnout“ ale svědomitost říká co lidi opravdu udělají, nejvíc se to pozná když chybí silná vnější motivace.
- svědomitost ale slabě koreluje negativně s IQ - kompenzační funkce svědomitosti
- svědomití lidé méně: chlastají, fetují, jsou silniční piráti, používají násilí. (Svědomitost v tomto smyslu bude téměř opakem „vyhledávání vzrušení“ (sensation seeking))
- pokud jedinec chápe důsledky nebezpečného chování (vyšší IQ) ale stejně si nemůže pomoct (slabá síla ega, svědomitost) tak může být „svědomitost“ lepším prediktorem pracovního vhodnosti/výkonu než IQ…
Ostatní faktory big5
- neuroticismus: významný u práce v stresujících podmínkách, nízký neuroticismus = emoční vyrovnanost
- extraverze: interpersonální kompetence výhodné u manažerských a obchodnických pozic, velmi dobré když je zároveň spojena s emoční stabilitou (nízkým neuroticismem).
- extraverzi lze vnímat i jako tendenci k prožívání příjemných emocí (Watson a Clark 1997), extroverti jsou šťastnější než introverti
- příjemnost: důležité u pozic vyžadujících interpersonální interakci: zákaznická podpora
- jak měřit? nejčastěji sebeposouzením (selfreport), dále pozorováním; dokonce ji lze manipulovat experimentálně jako nezávislou proměnnou.
- nástroje pro sebeposouzení: Big Five inventory, Personality Item Pool - jedna z verzí NEO.
- otevřenost („Faktor 5“), nejméně jasný faktor z Big5 (co to vlastně znamená?) , smysluplná asi jen u uměleckých a kreativních pozic, jinde smíšené výsledky; ovlivňuje ale úspěch výcviku/tréninku
- buďto otevřenost k druhým lidem - projevovaná verbální zdatností, humorem, vyjadřováním emocí v soc.vztazích.. nebo otevřenost novým zkušenostem (obecnější)
Omezenost Big5 a částečně i jiných inventářů
- hrozí podvodné odpovídání, které se skutečně děje, lze je v cca 40% případů odhalit i omezit
- „nízká validita“, rysy vysvětlí maximálně 15 % rozptylu prac.výkonu, přesto se hodí pro doplnění
další inventáře
- Minnesotský inventář - MMPI-2 (viz Svoboda, str.386+) současná verze z r. 1989, 567 položek, sejmutí trvá přes hodinu,… spousta škál, existují i zkrácené verze
- 16 PF-5 (Cattel), (Svoboda str.402+)
- Leary - ICL (viz Svoboda, s.370+). 1956-57. 4 kritéria maladaptace (umírněnost/intenzita, flexibilita/rigidita, stabilita/oscilace, přesnost+přiměřenost), 5 úrovní interpersonálního chování: veřejná komunkace, vědomá komunikace, psychické soukromí, nevědomá rovina, hodnoty a ideální já. Výsledkem je 16 kategorií.
- Jenkins Activity Survey - 1964, 3 faktory: hard, job, speed (viz Svoboda, str.353-4)
- Gordonův osobnostní profil - inventorium - GPP-I (Svoboda, str.367): cca 25 min., nucená volba ze tří výroků, volí se nejvíce a nejméně odpovídající výrok. Čtyři aspekty osobnosti: převahu, zodpovědnost, sociabilitu, emoční stabilitu. „primárně určen pro oblast psychologie práce a organizace - pro výběr, vedení, vzdělávání, či trénink a personální poradenství. České vydání 1999“
- Eysenckův osobnostní dotazník EPI 1964 (Svoboda,. s.382+). Paralelní formy A,B; srozumitelné formulace, zcela nezávislé škály extraverze a neuroticvismu, navíc verifikační škála. Rozšíření - Eysenck Personality Questionnaire EPQ 1975
Sebeposuzovací inventáře integrity
integrita ~ čestnost, poctivost
- inventáře se snaží nahradit detektor lži který se do r.1988 používal v USA běžně dokud nebyl zakázán, jeho validita je stejně sporná a je u něho spousta false positives
dvě kategorie
- podobné osobnostním testům, výhodou je že i když jsou postavené na self-reportech, nemusí být probandovi jasné co měříme a tak nemá co zkreslovat (nebo zkresluje něco jiného než měříme)
- zjevné
- popsat své vlastní minulé chyby („kolikrát jste něco ukradl minulému zaměstnavateli“, „předstíral jste někdy že jste nemocný“) - jdou přímo k tomu co nás zajímá, ale můžeme pak potrestat ty co byli čestní a přiznali to; v testech máme lžiskóry aby ukázaly nepřirozeně „poctivé“ lidi (předpokládáme že to není možné)
- sdělit svůj postoj k vybraným chováním u jiných lidí (např tvrzení „kdokoli co něco ukradne je zloděj a měl by být podle toho potrestán“), předpokládáme vztah mezi postojem k (ne)čestnosti u druhých a vlastní nečestcností; výzkum ale moc tenhle vztah neprokázal
- asi největší metaanalýza na osobnostní konstrukty kdy udělaná: Ones, Viswesvaran & Schmidt, 1993 - 665 validizačních koeficientů u víc jak půl milionu lidí: validita pro testy integrity jako prediktoru prac.výkonu 0.25 (očištěná 0.41), pro kontraproduktivní práci 0.27(0.39) ⇒ pokud se tyhle škály přidají k testům IQ je to ideální
Možnosti a limity testování.
- etická pravidla má APA a každá jiná profesní asociace jinde ve světě vč ČR, psycholog i v rámci firemní diagnostiky by se tím nějak měl řídit
Omezení sebeposuzovacích metod.
- člověk si může vymýšlet ať už do plusu (při testování do práce) nebo do mínusu, proto existují lžiskórové škály (MMPI,…) pro to abychom to mohli snáze rozpoznat.
- měly by se používat v kombinaci s jinou metodou
„V posuzovacích škálách měly být důsledně používány jen kategorie chování, tj. kategorie expresivní formy psychických jevů, nikoliv kategorie psychických procesů a stavů. Extrapolace z expresivní formy psychických jevů na úroveň psychických procesů a stavů může být teprve záležitostí psychologické diagnózy ve druhé fázi procesu posuzování, kdy dochází ke konfrontaci dat získaných posuzovací škálou s daty získanými speciálním psychologickým vyšetřením úrovně a charakteru psychických procesů a stavů i osobnosti v dimenzích její statiky a dynamiky.“ (Kohoutek, 2002)
Psychologické aspekty online testování.
Svoboda 2013, kap. 6 (s.33nn.)
- klasické testy se dnes vyskytují i v elektronické interaktivní verzi
- některé testy se administrují přes internetě
- některá omezení: fenomén úzkosti při práci s počítačem vyskytující se u některých lidí pro které je nový - který ovlivní výsledek testu, který má měřit něco jiného než toto
- validita a reliabilita komputerizované verze testu ověřovaného jen v původní tužka-papír verzi není automaticky zaručena!
- výkonové testy tím jsou víc ovlivněné, dotazníky méně, např. MMPI je už ověřené že je ekvivalentní tužkapapír verzi
- online verze jsou pro administrátory výhodné ze spousty důvodů …
- ve firmní sféře se do el.podoby přenášejí i takové věci jako assessment centrum (Motiv P - Virtuální AC), není to sice náhrada AC, ale je to časově náročné, a o člk se firma dozví hodně věcí a relativně levně, čas to stojí jen testovaného (zájemce o práci)
- CAT - computerized adaptive testing - funkce která výrazně rozšiřuje známé přeskakování položek u WISC/WAISu u vyššího věku na to, že se přeskakují položky dynamicky podle struktury odpovědí, aby se testovalo na hranici možností probanda. Test může být kratší a přitom stále přesný
Predikování pracovního chování na základě výsledků testů.
Testy situačního úsudku (Situation Judgment Tests, SJT): „any paper-and-pencil test designed to measure judgment in work settings’ (McDaniel, Morgeson, Finnegan, Campion & Braverman, 2001, p. 730) teoreticky může být i na PC, používá se už desítky let k posouzení jak lidi reagují na modelové situace
- posouzení je zpravidla pro pracovní účely dostatečné
- s kognitivními schopnostmi koreluje jen někdy a u něčeho
- metody skórování: empirické, teoretické, smíšené, expertem, faktoriální, vytváření podskupin
- co vlastně SJT měří? SJT jsou metodou, měří latentní psychologické konstrukty, dřív se to bralo že jde vlastně o zjišťování sociální inteligence, interpersonální kompetence atd, zatímco akademické testy měří inteligenci a to je něco jiného. Ve skutečnosti i výsledky SJT sytí obecný g faktor. Měří se ale i schopnost selského rozumu, zkušenosti a obecné znalosti, nikoli přímo logické myšlení.
Školní známky, celkové skóre (General Grade Point Average, GPA)
- používáno dlouho, ale je vůči tomu hodně kritiky
- hodně zaměstnavatelů na základě výsledného prospěchu odmítá posuzovat uchazeče, někdy se to ignoruje, ukazuje se že někdy jsoudoporučeni i lidi s nižším GPA
- z výzkumného hlediska to ale je důležité - netřeba nic dalšího měřit a máme o člověku ukazatel který se mezi lidmi hodně liší, z toho se dají dělat longitudinální pozorování jak to s čím souvisí atd. Takže má smysl studovat validitu GPA jako prediktoru pracovního výkonu a kariérní úspěšnosti.
- Thorndike už v 1903 oceňoval že vzdělávací instituce nejen že učí, ale ještě lidi hodnotí a označují ty kteří jsou dobří
- Nicholson v 1915 zjistil že úspěšní lidi ve škole pak víc uspějou i v reálném životě a práci. První longitudální výzkum tohoto typu
- Toops a Pintner 1919 potvrdili že úspěšnější lidi ve škole a vzdělanější byli obchodně úspěšnější
- Metaanalýza Bretze z 1989 co srovnával 50 studií od 20. do 70.let aby prozkoumal validitu GPA jako prediktoru úspěšnosti, výsledky se ohromně lišily, velikosti účinku taky, jediné co platilo je že lidi s dobrými známkami na konci VŠ na tom jsou líp. Jako prediktor nástupního platu výsledky před dokončením VŠ nefungovaly, ani jak se bude plat vyvíjet.
- McCleland 1973 zdůrazňoval potřebu sledovat neakademické kompetence k posouzení pracovního úspěchu, masivně znevažované začala být užitečnost IQ a známek s příchodem D.Golemana, jeho kritiky omezenosti IQ a důležitosti emoční inteligence.
- Barrett a Depinet 1991 ale McClellandovy výsledky zpochybnili, známky a IQ úspěch ovlivňují, i s vyloučením sociálního statusu, handicapu menšin ap.
- GPA lze brát jako ukazatel budoucího potenciálu / intelektuální kompetence.
TODO speciální testy inteligence apod.
Prediktivní validita a reliabilita testů užívaných při výběru pracovníků.
Prediktivní síla IQ (GMA, general mental ability)
Chamoro-Premuzic a Furnham
- inteligence ve smyslu GMA jednoznačně predikuje výsledky v práci, není o tom debat, důkazy se o tom vrší od 1.světové války, přesto se inteligenční testy ve výběrových řízeních příliš nedělají resp. se to hodně liší v jednotlivých zemích (a nevypadá to že by na tom stál ekonomický ne/úspěch země, viz Německo na chvostu) (Dany & Torchy, 1994):
- r = 0.72 (50 % rozptylu pracovního zařazení lze vysvětit úrovní mentálních schopností) (Schmidt & Hunter, 2004)
- Nejlepší prediktory vedle GMA: prostorové, mechanické a percepční schopnosti, už v 70. letech existovaly testy pro všechny typy povolání (Ghiselli 1973), inteligence, prostor. představivost apod. hrají roli u vedoucích pracovníků a administrativy, naopak nehrály roli u prodavačů a dělnických profesí; tam měly stále význam osobnostní rysy …
- u vyšších pozic je mnohem menší šance že narazíme na jedince s nízkým IQ než obráceně (u nižších pozic jedince s vysokým IQ). „lenost může jinak zářivé lidi vést k jednoduchým povoláním, ale tvrdá práce může těžko neschopné lidi uschopnit dělat tak komplexní práci ; na vyšších pozicích je značná homogeneita vysokého IQ. Obří meta-analýza 425 studií GMA-prac.výkon (Hunter 1980, 1984) ukázala vztah u všech druhů práce, ale silnější u komplexnějších pozic, novější meta-analýzy to stále potvrzeují (viz Chamorro-Premuzic a Furnham, s.106).
- přesto že GMA je nejlepší prediktor, by se pro některé věci měly používat i další testy které mají svou inkrementální validitu (zejm. pro svědomitost, integritu osobnosti ap.)
- výše uvedené negarantuje longitudinální validitu GMA na predikci pracovního výkonu (kauzalita není korelace;-), ale i na to jsou velmi přesvědčivé výsledky:
Longitudinální důkazy
- jeden z prvních výsledků: Austin a Hanisch (1990). Testy IQ z dob školy predikovaly výsledky v práci o 11 let později
- Lidé s vyšším IQ tendují k povýšení a obráceně, (Wilk a Sackett 1995), ještě zvýznamněné při porovnání vlastního IQ a průměrného IQ v rámci dané profese a pozice (Wilk a Sackett 1996)
- platí to i při zahrnutí socioekonomického statusu
- úspěch v práci víc závisí na vlastním IQ než na práci rodičů
- nejepší longitudinál: Judge et al., 1999, až 40 let do minulosti: GMA změřené ve 12 letech koreluje s úrovní v práci r=0,51 a příjmem r=0,53 (skoro o 40 let později!), nejbližším dalším prediktorem byla svědomitost z Big 5 a i tam měla o 60 % slabší prediktivní sílu.
Proč se teda IQ tolik nepoužívá a je neoblíbeným?
- pro přesnou predikci vhodnosti jsoui potřeba specifické kognitivní schopnosti a ne obecná schopnost vyjádřená hodnotou IQ? To by odpovídalo původní Spearmanově konceptualizaci GMA
- průměrný zaměstnavatel asi podceňuje skutečný dopad indiv.rozdílů které ovlivňují prac.výkon, a moc se spoléhá na hodnocení sociálního a ne výkonovéhon chování, ačkoli to sociální moc s produktivitou a výkonem nesouvisí. Snaživci se tolerují byť jejich produktivita je nízká, naopak lidi co jsou nespolehliví, chaotičtí a rozhádaní jsou trestáni byť netto produktivita může být pořád vyšší než těch „hodných“
- 3krát g - general, genetic, group differences (obecné, genetické a skupinové rozdíly) - samá politicky nekorektní zjištění…
- krom GMA je náš (ne)úspěch zakódován tak trochu v genech (vysvětlující kolem 25 % - Gottfredson, 2004).
- dalším problémem jsou jiné rozdíly v testech u jiných ras kde zbývá stále až 1 směrodatná odchylka u ne-bělochů i při použití culture-fair testů (Gottfredson, 1986, 1988, 2005; Jensen, 1980, 1998)
Sociální důsledky
- pokud jsou předpoklady víceméně dány a jsou jen málo ovlivnitelné, znamená to že jedinci s nižším IQ jsou odsouzeni a handicapováni už ve chvíli kdy se dostanou do adolescence nebo začnou hledat první práci?
- pokrok vyžaduje stále inteligentnější lidi, požadavky na prac.pozice jsou stále víc „g-loaded“
- „je stále těžší pro lidi nižší inteligence víc vydělávat a dostávat se na pozice s vyšším soc.statusem, naopak jsou častěji nezaměstnaní a technologický pokrok je činí zbytečnými, protože je čím dál víc lze nahradit stroji“
vyšší IQ a lepší chování v práci
- IQ snižuje dokonce i výskyt „kontraproduktivních pracovních chování“ (častější absence, zneužívání firemních zdrojů)
- „workplace deviance“
- údajně až 200 miliard dolarů roční ztráty jen v USA kvůli tomuhle (Greenberg, 1997; Murphy, 1993; Vardi & Weitz, 2004; Bennett & Robinson, 2000)
- proč? „inhibiční účinky vyššího IQ“ - chytřejší lidi si dokážou předem líp spočítat negativní důsledky svého chování a jednání
- hloupí lidé proti tomu tuhle jasnost postrádají a proto dělají častěji blbosti
Prediktivní síla Big5 a jiných inventářů na osobnostních rysy
- R^2 max cca 15 % rozptylu
- nejvýznamnější je svědomitost z Big5