Mitä on ergoodisuus ja mitä se merkitsee psykologian tutkimukselle
”Indeed, this has been pinpointed as one of the major problems of mathematical psychology by Luce (1997): our theories are formulated in a within-subjects sense, but the models we apply are often based on between-subject comparisons”
– Denny Borsboom, kirjassaan Measuring the Mind (2005)
Määritelmä
Jos yhtä kolikkoa heitetään tuhat kertaa saadaan odotusarvoisesti sama määrä klaavoja kuin tuhatta kolikkoa kerran heitettäessä. Kolikonheitto on siten ergoodinen prosessi: lukuisia yksiköitä samanaikaisesti tutkimalla saadaan sama tulos kuin yksittäistä pitkään tutkimalla. Tämä on yleistettävyyden kannalta keskeistä, sillä tämän ergoodisuusoletuksen pätiessä tulos voidaan yleistää joukosta kolikoita yksittäisiin lantteihin. Tästä ergoodisuudessa on pähkinänkuoressa kyse: voidaanko ryhmätasolla havaitun ilmiön päätellä olevan olemassa vastaavalla tavalla myös yksilötasolla. Käsite tulee samannimisestä matematiikan haarasta, joka tutkii kuinka ns. dynaamisten järjestelmien (kuten ihmisen) ominaisuudet näyttäytyvät pitkittäis -ja poikittaisleikkauksissa. Matemaattista psykologiaa edustava tutkija Peter Molenaar on kirjoittanut paljon aiheen merkityksestä, ja miksi psykologian tulisi sen johdosta panostaa yksilökeskeiseen tutkimukseen.
Ongelma
Psykologiassa tutkimuslöydös näyttäyy usein koeryhmien keskiarvoerona tai otoksen laajuisena tilastollisena mallina: ryhmätason tuloksena. Näillä asetelmilla löydettyjen ilmiöiden toivotaan usein paljastavan jotain mielen koneiston toiminnasta. Esimerkiksi löydökset monista kognitiivisista vinoumista perustuvat erilaisia tehtäviä suorittavien koeryhmien vertailuun. Tulokset kertovat tehtävissä toimittavan keskimäärin eri tavalla, minkä tulkitaan kertovan jostakin systemaattisesta mielen oikusta. Vastaavasti Stroop-vaikutusta on tutkittu teettämällä samoilla ihmisillä kaksi erilaista tehtävää, ja keskiarvoistamalla näiden ero yli koehenkilöiden. Tämä kertoo tehtävätyypeissä suoriuduttavan keskimäärin eri lailla, minkä myös on tulkittu luonnehtivan jotain kognitiivisesta arkkitehtuurista. Kolmantena esimerkkinä, mm. persoonallisuuden viisi suurta piirrettä perustuu ryhmätason korrelaatiohahmoon persoonallisuuskyselyiden kysymyksissä. Tilastollisesti tämä kertoo ihmisten vastaavan tietynlaisiin kysymyksiin keskimäärin samalla (tai eri) tavalla, mistä päätellään yleisten ominaisuuksien olemassaolo. Toisin sanoen, monenlaisilla asetelmilla ja tilastomenetelmillä ryhmätasolla saaduista tuloksista halutaan tulkita universaaleita tai yleisiä mielen piirteitä, mikä tarkoittaisi näiden olevan olemassa lähes kaikilla tai vähintään enemmistöllä ihmisiä.
Tällaisten päätelmien tekeminen tasojen välillä kuitenkin olettaa ergoodisuuden pätevän, mutta todellisuus voi olla jotain ihan muuta. On helppo nähdä miksi oletus harvoin pätee psykologiassa. Sen toteutumiseksi jokaisen yksilön tulisi noudattaa samoja tilastollisia lainalaisuuksia, mikä vaikuttaa ihmistieteissä harvemmin toteutuvan edes karkeasti. Tästä seuraa että yleistämistä ryhmätasolta yksilötasolle ei voida automaattisesti tehdä, jolloin joudutaan tyytymään agnostisuuteen: ryhmätasolla havaittu ilmiö joko on, tai ei ole olemassa myös yksilötasolla, tai sitten se voi ilmetä vain osalla ihmisistä.
Merkitys
Psykologiassa halutaan useimmiten ymmärtää ihmisen sisäisiä prosesseja sekä soveltaa tutkimustietoa yksilöihin esim. elämänlaadun parantamiseksi tai jonkin ominaisuuden arvioimiseksi. Kun iso osa tutkimustiedosta pohjautuu ryhmätason tarkasteluihin, jää uskonloikan varaan kuinka sovellettava löydös on yksittäiseen henkilöön ja kuinka yleisluontoisesta ilmiöstä puhutaan. Teorianmuodostuksen tasolla on riski ilmiön väärinymmärtämiseen. Esimerkiksi jos ilmiö koskettaa osaa ihmisistä ja sitä luonnehditaan yleisenä, jää pimentoon, että pitäisi etsiä selityksiä sille miksi se koskettaa vain osaa. Pahimmillaan ryhmätason tulos ei edusta juuri ketään, jolloin se väistämättä johtaa virheellisiin teoreettisiin tulkintoihin.
Koen itse asian joissakin konteksteissa todella intuitiivisena ymmärtää, mutta toisissa vaativan oivallusta. Jokainen psykologi ymmärtää, että vaikka ihmiset voivat keskimäärin hyötyä psykoterapiasta, jokainen (tai tietty) yksilö ei siitä välttämättä hyödy. Nyt tämä intuitio pitäisi yleistää kaikkeen tietoon, joka perustuu ryhmätason löydöksiin: jokainen ihminen ei välttämättä ilmennä (ainakaan kaikkia) kognitiivisia vinoumia, Stroop-efektiä, tai tietynlaista persoonallisuuden tai kognition rakennetta.
Lisäksi ergoodisuus aiheuttaa hankaluuksia psykometriikalle; psykologisten mittareiden kehittämiselle ja soveltamiselle. Mittarit usein rakennetaan ryhmätason korrelaatiorakenteiden pohjalta, mutta nämä eivät välttämättä ole yhteneviä mikäli sama yksilö tekisi testin lukuisia kertoja (tilanteessa jossa mitattavassa ominaisuudessa voi tapahtua muutosta). Esimerkiksi jos haluan mitata mielialaani jollain vakiintuneella kysymyspaketilla päivittäin vuoden ajan, kysymysten keskeiset korrelaatiot voivat vaihdella eri vaiheessa ajanjaksoa. Kenties ensimmäisen kolmenneksen ajan kysymykset korreloivat keskenään vahvasti, seuraavalla kolmanneksella ne ovat heikompia ja viimeisellä niitä ei enää ole. Tällöin joudun toteamaan, että joko mitattava ominaisuus tai mittarin kyky tavoittaa se on kadonnut. Tämä on extreme-esimerkki, mutta mikä tahansa ajallinen muutos mittarin sisäisessä korrelaatiorakenteessa vääristää mittaamista ellei sitä kyetä huomioimaan.
Ratkaisut
Yleistettävyyden rajoitusten tiedostaminen
Mihin ryhmätasolla saatuja tutkimustuloksia voidaan soveltaa mikäli ergoodisuusoletus rikkoutuu? Tietenkin samalle tasolle, josta tulokset ovat peräisin, jolloin ei vaadita uskonloikkaa tasojen välillä. Jos esimerkiksi on tarkoitus vähentää itsemurhien esiintyvyyttä (esiintymisprosentti = ryhmätason tunnusluku), tutkimustulos jossa havaittiin otostasolla itsemurhien osuuden vähentyneen jonkin toimenpiteen jälkeen on tähän täysin legit. Sama ajatus on myös ns. nudge-toimenpiteissä, joissa pienillä muutoksilla ympäristöön tavoitellaan muutosta suurten ihmisjoukkojen toiminnassa.
Perustutkimuksessa ja tieteellisten teorioiden muodostuksessa tulee ymmärtää, että päätelmiä yleisluontoisista mielen mekanismeista (saatikka niiden suuruusluokasta) ei voida tehdä ennen kuin kyseiset ilmiöt todetaan yksilötasolla suurella joukolla populaatiota. Vain osalla ihmisiä esiintyvä ilmiö kaipaa teoreettista selitystä miksi se koskee vain osaa, mutta ei kaikkia. Pieni vähemmistökin voi riittää tuottamaan tilastollisesti merkitsevän tuloksen. Jos vähemmistö ilmentää todella voimakkaasti jotain ilmiötä, ja loput eivät lainkaan, ryhmätasolla havaitaan varsin vaatimaton tulos. Tämä voi kuitenkin olla teoreettisesti harhaanjohtavaa, sillä tämä tulos ei luonnehtisi hyvin kumpaakaan porukkaa, vaan antaisi ainoastaan signaalin, että jossakin tapahtuu jotain.
Ergoodisuus ei ole kaikki-tai-ei-mitään -asia, ja sen rikkoutumisessa on aste-eroja, minkä pohjalta voidaan tehdä kompromisseja. Yksittäisen ihmisen käsien lukumäärä on ajan saatossa suurinpiirtein sama väestön käsikeskiarvoon nähden, ja vaikkei tämä vastaavuus täydellinen olekaan, on käytännöllistä toimia ajatellen että se ei ole satunnaismuuttuja. Ergoodisuusoletuksen rikkoutuminen aiheutuu yksilöiden välisistä eroista ilmiöissä, ja mikäli nämä on mahdollista tilastollisesti vakioida, päätelmiä voidaan tehdä ehdollisen yhtäpitävyyden pohjalta. Tämä on kuitenkin vaikuttaa monumentaaliselta tehtävältä, ja kaukana pelkästään iän ja sukupuolen lisäämisestä tilastolliseen malliin, mitä sillä yleensä tarkoitetaan.
Idiografinen tutkimus
Myös yksilöt voivat olla kvantitatiivisen tutkimuksen kohteena. Sekä datankeruu- että analyysimenetelmät näitä varten ovat kehittyneet huomattavasti tämän vuosituhannen aikana, minkä seurauksena yksilöitä luonnehtivien psykologisten aikasarjojen soveltaminen tutkimuksessa on yleistynyt hurjasti. Nettipohjaiset datankeruuinfrat, kuten ns. ecological momentary assessment -menetelmä mahdollistavat kyselyiden ja tehtävien teettämisen yksilöillä melkeinpä niin usein kuin tarvis. Kun samalta ihmiseltä saadaan intensiivistä aikasarjadataa pitkältä ajalta, voidaan sekä ilmiöiden dynaaminen luonne että yksilöllisyys huomioida eksplisiittisesti.
Ylläkuvatun takia ennustan / varovaisesti toivon psykologin ammatinharjoittajan työn tulevan olemaan tulevaisuudessa datakeskeisempää. Perustutkimuksessa voidaan kerätä päivä, tai jopa tuntitasoista tietoa vastaajien mielialasta yms ominaisuuksista, jolla voidaan mallintaa yksilön sisäistä dynamiikkaa näiden suhteen. Olisin onnessani mikäli tulevaisuudessa menetelmätietoiset kliiniset psykologit käyttäisivät vastaavia menetelmiä rakentaakseen asiakkaan tuottamasta datasta yksilöityjä oireverkkoja, jotka luonnehtivat hänen yksilöllistä oiredynamiikkaansa. Alustavan tutkimuksen mukaan aikasarjoista voidaan tunnistaa mm. masennusjakson alkaminen, ja näitä voisi periaatteessa käyttää varhaisina varoitusjärjelminä. Toki menetelmät itsessään ovat vielä melko tuoreita, joten jää nähtäväksi kuinka suuri kliininen hyöty niistä lopulta on.
Psykologisten ilmiöiden yleisyyden tutkiminen
Jatkona edelliseen: ryhmätasolta aloittamisen ja yksilöihin yleistämisen sijaan mielekkäämpää voisi monissa tutkimuskohteissa olla aloittaa yksilöistä, ja nousta kohti yleistystä ryhmätasolle. Jos ihmisissä on tutkittavan ilmiön suhteen paljon heterogeenisyyttä, ensimmäisessä strategiassa riskinä on että tulokset eivät kuvaa oikein ketään. Esim. kognitiivisten vinoumien tutkimusta voisi vaihtoehtoisesti tehdä siten, että tutkitaan aluksi esiintyykö hypotetisoitua bias X:aa kenelläkään, sen jälkeen kuinka yleinen ja minkä vahvuinen se on. Lopulta kun ilmiötä on tutkittu yksilölähtöisesti sen verran että ymmäretään sen yleisyyttä ja suuruusluokkaa, voidaan alkaa tutkimaan sitä mikä eron näiden ihmisten välille aiheuttaa, tai mitä mielen mekanismeja siihen kytkeytyy.
Loppusanat
Sattuneista syistä olen kirjoittanut psykologian näkökulmasta, mutta sanomattakin selvää, että asia koskee muitakin tieteitä, jotka soveltavat tilastotiedettä ymmärtääkseen tilastollisia yksiköitään. Aihe on hiljattain nostettu esiin myös mm. taloustieteessä ja neurotieteessä.
Lopulta ergoodisuudessa on kyse siitä, minkä jokainen jo tietää sydämessään: ihmiset ovat erilaisia. Uudet idiografiset työkalut tarjoavat uuden datalähtöisen tavan ymmärtää ja tarkastella yksilöitä, joiden elämän kannalta psykologit tekevät päätöksiä. Tutkimustiedon merkityksen kannalta on oleellista hahmottaa, onko ilmiö riittävän yleisluontoinen ollakseen perustava mielen rakennuspalikka, vai onko kyseessä muutaman outlierin takia nippa nappa tilastollisen merkitsevyyden saavuttanut kuriositeetti.
Acknowledgementit
Matti Heinolle kiitos konsultaatiosta
www.mattiheino.com, twitterissä
Linkit
Adolf J. K. & Fried E. I. (2019) Ergodicity is sufficient but not necessary for group-to-individual generalizability. PNAS
Epskamp S, van Borkulo C. D., van der Veen D C, Servaas M. N., Isvoranu A-M., Riese H. & Cramer A. O. J. (2018). Personalized Network Modeling in Psychopathology: The Importance of Contemporaneous and Temporal Connections. Clinical Psychological Science
Fisher A. J., Medaglia J. J & Jeronimus B. F. (2018). Lack of group-to-individual generalizability is a threat to human subjects research. PNAS
Megadlia J. D., Ramanathan D. M., Venkatesan U. M. & Hillary F. G. (2011). The challenge of non-ergodicity in network neuroscience. Network: Computation in Neural Systems
Molenaar P. C. M. & Campbell C. G. (2009) The New Person-Specific Paradigm in Psychology. Current Directions in Psychological Science
Molenaar P. (2005). A Manifesto on Psychologyas Idiographic Science: Bringing thePerson Back Into Scientific Psychology, This Time Forever. Measurement
Molenaar P. (2007). On the implications of the classical ergodic theorems: Analysis of developmental processes has to focus on intra‐individual variation. Developmental Psychology
Nesselroade J. R. & Molenaar P. (20116). Some Behaviorial Science Measurement Concerns and Proposals. Multivariate Behavioral Research
Olthof M, Hasselman F. & Strunk G. (2019). Critical Fluctuations as an Early-Warning Signal for Sudden Gains and Losses in Patients Receiving Psychotherapy for Mood Disorders. Clinical Psychological Science
Olthof M. (2019). How to study early-warning signals for clinical change. https://psych-networks.com/how-to-study-early-warning-signals-for-clinical-change/
Peters O. (2019). The ergodicity problem in economics. Nature Physics
Schmiedek F., Lövden M., von Oertzen T & Lindenberger (PREPRINT) Within-person structures of daily cognitive performance cannot be inferred from between-person structures of cognitive abilities. PeerJ Preprints
Voelke M. C., Brose A., Schmiedek F. & Lindenberger U. (2014). Toward a Unified Framework for the Study ofBetween-Person and Within-Person Structures:Building a Bridge Between Two ResearchParadigms. Multivariate Behavioral Research