tiistai 21. huhtikuuta 2020

Tilastollinen totuus

Tilastomatemaattisen päättelyn rajoituksista

Noin 46-47 vuoden takaa muistan professori Kaupin filosofian luennolta toteamuksen, että tilastolliset menetelmät johtavat tilastolliseen totuuteen. Tämä on totta, eikä vain tilastollisesti totta. Tämän koronakriisin aikana ovat tulleet tutuiksi erilaiset numeeriset, matemaattiset ja tilastolliset ilmaisut, jotka kuvaavat taudin leviämistä ja vaarallisuutta, sellaisia kuten 'tarttuvuusluku', 'eksponentiaalinen kasvu' ja 'kuolleisuusaste'. Matemaattisten ja tilastollisten mallien väistämätön perusluonne on se, että asiat pitää yleistää ja pelkistää rajalliseen määrään muuttujia, parametreille täytyy antaa tietyt arvot ja tarkasteltavaa populaatiota ajatellaan ko asian suhteen aika lailla yhtenä joukkona. Todellisuus on kuitenkin usein mutkikaampi kuin mallit, mikä on syytä muista kun  tehdään päätelmiä asioiden tilasta ja mitä niille voi tehdä. Suomalainen tutkijajoukko on laatinut havainnollisen interaktiivisen mallin taudin vaikutuksista erilaisilla parametrien arvoilla, osoitteessa korona.kausal.tech. Malli on tuolla sovellettu HUSin alueen tilanteeseen. Heitän tässä muutaman kommentin mallien yleistettävyydestä, noin yleisesti.

Nyt pohditaan eri puolilla maailmaa viruksen aiheuttamien rajoitusten höllentämistä, mutta maat ovat monessa suhteessa hyvin erilaisessa tilanteessa ja on riskaabelia vetää johtopäätöksiä muiden maiden tilanteesta. Viruksesta on ilmeisesti levinnyt varsin erilaisia kantoja (mutaatioita). Kiinalaiset tutkijat ovat julkaisseet raportin, jossa kertovat löytäneensä vain 11 potilaan joukosta 33 erilaista Covid-19 viruksen tyyppiä. He arvelevat, että Etelä-Euroopassa ja New Yorkissa esimerkiksi on liikkeellä haitallisempi versio kuin esimerkiksi USA:n länsirannalla. Maiden kulttuurierot vaikuttavat paljon  leviämiseen. Kun se alkoi levitä Italiassa ja Ranskassa, kiinnitettiin huomiota poskisuudelmiin. Italiassa iso leviämispesäke oli yksi jalkappalo-ottelu, jossa oli kymmeniä tuhansia katsojia.

Virus vaikuttaa hyvin eri tavoin eri ikäryhmiin ja ihmisiin, joilla on jokin muu sairaus tai ei ole. Kuitenkin vaikutusta mitataan aina suhteessa koko populaation, esim. yhdellä kuolleisuutta osoittavalla luvulla. Eri maissa kerrottuihin prosenttiosuuksiin liittyy tietysti suuria epävarmuustekijöitä: juuri missään ei ole oikeasti vielä tiedossa oikeaa levinneisyyttä ja kuolleiden lukuja verrataan testattujen positiivisten lukumäärään, kuolemien tilastoinnissa on suuria virheitä jne.

Suomessakin suunnitellaan nyt rajoitusten purkua ja sikäli realistisesta näkökulmasta, että rajoitukset tulee kohdentaa tarkemmin kuin vain koskemaan samalla lailla kaikkia toimintoja ja kaikkia ihmisryhmiä. Tässä pitää tietenkin edetä harkitusti ja pitäisi oikeasti selvittää eri kohteiden riskit. Pitäisi selvittää levinneisyys pätevillä otantatutkimuksilla (tilastotieteestä on tässä paljonkin apua) ja varmistaa riskiryhmien suojauskäytännöt.

Ei kommentteja:

Lähetä kommentti