Optimististen kuolleisuusarvioiden epidemia. Kaikki, mitä halusit tietää Covid-19:n kuolleisuudesta, osa 1.


Media on tarttunut innokkaasti optimistisiin vertaisarvioimattomiin tutkimustuloksiin, joiden on tulkittu tarkoittavan Covid-19 kuolleisuuden olevan oletettua alhaisempi 0,1 % - 0,2 %. Julkaisemme moniosaisen analyysin, jossa perehdymme kuolleisuuteen liittyvään näyttöön. Uskomme tekemämme taustatyön perusteella, että parhaaseen näyttöön perustuva arvio Covid-19:n todellisesta kuolleisuudesta on edelleen lähempänä 0,6-1,0 % haarukkaa. Ensimmäisessä osassa tutustumme serologisiin [1] tutkimuksiin ja siihen, miksi niiden tulokset eivät välttämättä tarkoita yhtään mitään.

Muusta sivustostamme poiketen tämä kirjoitus on lähtökohtaisesti kantaaottava. Pyrimme silti parhaan kykymme mukaan arvioimaan näyttöä tasapuolisesti.

"COVID-19 Antibody Seroprevalence in Santa Clara County, California" ilmestyi verkkoon 17. huhtikuuta. Kolme päivää myöhemmin siitä tuli covid-19 -kriisin jaetuin, kommentoiduin ja uutisoiduin vertaisarvioimaton tieteellinen julkaisu. Kun vertaisarvioidut artikkelit otetaan huomioon, Bendavid et al. yltää kolmannelle sijalle.

Bendavidin tutkimuksen suosio

Artikkelin suosio ei ole ihme. Stanfordin yliopistossa vaikuttava Bendavidin tutkimusryhmä arvioi, että noin 2,5 % - 4 % väestöstä olisi tuottanut vasta-aineita virukselle ja olisi näin ollen jo sairastanut taudin näytteenottohetkellä. Uutinen olisikin erittäin positiivinen, jos tutkimuksen luvuista vedetään samat johtopäätökset, kuin ilmeisen moni media: jos vasta-aineita on näin monella, taudin levinneisyys on 50-85 kertaa luultua korkeampi. Tällöin sairaalahoidossa olevat ja menehtyneet muodostavat luultua paljon pienemmän osuuden tartunnan saaneista - Covid-19 olisi sittenkin lähes yhtä vaaraton, kuin influenssa.

Maailman arvotetuimpiin epidemiologeihin kuuluva Trevor Bedford ei ollut alustavista tuloksista vakuuttunut: "Given how sensitive these results are to performance of the assay, I don't think it's safe to conclude that infections are "50-85-fold more than the number of confirmed cases". Myös bioteknologiayrittäjä ja työelämäprofessori Balaji Srinivasan suhtautui tuloksiin huomattavalla varauksella: "at the upper end that kind of false positive rate would mean 40/50 = 80% of the positives in the study could be false positives." Columbian yliopiston tilastotieteen professori Andrew Gelman oli vielä kriittisempi: "I think the authors owe us all an apology.. [The numbers] were essentially the product of a statistical error."

On huomionarvoista, että Heinsbergissä, Gangeltissa, Skotlannissa, Hollannissa, ja Ruotsissa tehdyt kokeet kärsivät käytännössä kaikki samoista ongelmista. Ruotsissa tutkimuksen takaisinveto aiheutti kansallisen skandaalin.

Kaupallisilla pikakokeilla tehtyjen pienen otannan serologisten tutkimusten tulkinnassa on oltava aivan erityisen tarkka kolmesta syystä:

1. Testattavat ihmiset eivät edusta koko väestöä, eivätkä etenkään alttiimpia riskiryhmiä - otos voi olla niin epäedustava, ettei sen perusteella voi päätellä perusjoukon ominaisuuksista yhtään mitään.

Otantaongelmat korostuvat uusien ilmiöiden kohdalla. Menetelmiä otannan rajoitteiden korjaamiseksi on paljon, mutta ne vaativat referenssiksi vertailuaineistoa. Esimerkiksi puolueiden kannatusta mitattaessa ei tarvita kattavaa otosta kaikilta paikkakunnilta ja kaikista ikäryhmistä, koska poliittisista kyselytutkimuksista on pitkä kokemus, ja vaalitulos tarjoaa keinot kalibroida kyselytutkimusten tuloksia. Uuden taudin käyttäytymisestä eri ihmisryhmissä ei vastaavanlaista tietoa ole tarjolla.

Santa Claran tapauksessa testattavia rekrytoitiin Facebook-mainoksilla ja kyseenalaisilla sähköpostiviesteillä, jolloin testattavaksi hakeutui koronavirusta itsellään epäilleitä ihmisiä. Tanskassa, Ruotsissa ja Hollannissa käytettyjä verenluovuttajia taas kuvaillaan tilastoissa ja tutkimuksissa korkeatuloisiksi, terveydestään huolehtiviksi, kaksi kertaa enemmän liikuntaa harrastaviksi ja 95-prosenttisesti alle 65-vuotiaiksi. Ikänsä puolesta riskiryhmiin kuuluvat eivät edes voi luovuttaa verta.

2. Serologiseen testaukseen nimenomaan Covid-19:n osalta liittyy useita tuntemattomia epävarmuustekijöitä.

Kokeet tehdään monen eri yrityksen tarjoamilla point-of-care-testeillä (PoCT), jotka on kehitetty nimenomaan koronavirusta varten. Yhdysvaltain elintarvike- ja lääkevirasto FDA ei ole antanut yhdellekään kaupalliselle testille hyväksyntää ja vain muutama kehitteillä oleva testi on saanut väliaikaisen Emergency Use -käyttöluvan. Testit saattavat tunnistaa vasta-aineita, jotka ovat syntyneet toisen taudin yhteydessä, kuten Britannia oppi kantapään kautta tilattuaan miljoonia kappaleita aivan tavanomaiseen nuhakuumeeseen reagoivia testejä. Ihmisissä kiertää ainakin neljä tunnettua koronavirusta, jotka aiheuttava lieviä nuhan oireita. Valmistajista riippumatonta tutkimusta kaupallisesti saatavilla olevien testien tarkkuudesta onkin toistaiseksi kovin vähän, eivätkä alustavat tulokset näytä lupaavilta.

3. Vaikka testien valmistajien väitteet testien tarkkuudesta pitäisivätkin paikkansa, 98% ei itse asiassa riitä, kun otoskoko on pieni.

Jos testaisimme esimerkiksi sata tervettä ihmistä testillä, joka tuottaa keskimäärin 2 väärää positiivista tulosta kahden täysin terveen ihmisen kohdalla, ja tauti esiintyy noin 2 % väestöstä, mitä voimme päätellä 100 testin tuloksesta? [2]

Harvinaisen taudin esiintyvyyden - prevalenssin - selvittäminen ja erilaisten seulontatulosten tulkinta on klassinen bayesilaisen päättelyn johdantoluennon esimerkkisovellus juuri sen vuoksi, että tulos ei ole intuitiivinen. Vain murto-osa nuorista lääkäreistä osasi kuuluisassa pistokokeessa tulkita seulontakokeen tuloksia oikein.[3]

Ylläolevaa esimerkkiä 100 testistä ja kahdesta väärästä positiivisesta voidaan jatkaa: jos vääriä positiivisia on keskimäärin 2, kuinka todennäköistä on kolme väärää positiivista? Entä neljä? Millä todennäköisyydellä 1000 testistä 30 on vääriä positiivisia?

Arvioita näihin vastauksiin voi hakea edellämainituista Gelmanin ja Srinivasanin esseistä, tai vilkaista jonkun jo julkaistun artikkelin tulosten posteriorijakaumaa Harvardilaisen tutkimusryhmän julkaisemalla interaktiivisella työkalulla.

THL-tutkimuksen posteriorijakauma

Suomessa THL teki alustavan vasta-ainemittauksen 442:sta HUS-labin ylijäämäverinäytteestä. HS uutisoi avainluvut: 442 näytettä ja jo 3,4 prosentille asukkaista on kehittynyt vasta-aineita taudille!

Jos THL:n alkuperäisen tiedotteen lukee huolellisesti, löytyvät siitä kaikkien kolmen viikon tulokset ja otoskoot. Positiivisia olivat ensimmäisellä viikolla 1/145 näytteestä, toisella viikolla 0/150 näytteestä ja kolmannella viikolla 5/147 näytteestä (0,7 %, 0 % ja 3,4 %).

Tutkimusta ei ole julkaistu missään ja sen metodologiaa sivutaan tiedotteessa vain muutamalla lauseella. Annettujen tietojen perusteella on mahdollista, että THL:n tutkimus erottuu edukseen muista seroprevalenssitutkimuksesta, mutta johtopäätökset taudin levinneisyydestä ja alhaisesta kuolleisuudesta ovat sen pohjalta ennenaikaisia. Helsingin Sanomien uutisessaan ulkopuolisena asiantuntijana haastatteleman Tuomas Aivelon sanoin: Koronavirustartunnan saaneiden määrä HUS-alueella ei tilastollisesti eroa nollasta.


*****

Kuinka moni on kuollut koronaan, ja kuinka monen viikon takaiseen tartuntalukuun kuolemia pitäisi suhteuttaa? Kuolleisuuden mittaamisen ja lukujen tulkintaan palaamme kirjoituksen 2. osassa.

Kolmannessa osassa perehdymme siihen, mitkä signaalit parhaiten soveltuvat kuolleisuuden arviointiin ja mitä niiden tulkinnassa täytyy ottaa huomioon. Käsittelemme mm. koko väestön kattavia PCR-tutkimuksia (kuolleisuus ~1-2 %), laajoja vasta-ainetutkimuksia (kuolleisuus ~1,4 %), RT-PCR-pohjaisia prevalenssiarvioita (kuolleisuus 0,8 - 1,1 %), sekä kaupunkien tai kuntien kokonaiskuolleisuutta (New Yorkissa 0,16 % koko väestöstä on rekisteröity kuolleeksi koronaan, Italian Nembrossa 1,3 % koko väestöstä).

Epidemia ei ole ohi, se on vasta edessä. Suomessa koronavirustapausten määrä ja kuolemat ovat pysyneet jopa poikkeuksellisen alhaisina todennäköisesti sen takia, että Suomessa suhteellisen harva iäkäs ihminen sai ensimmäisessä aallossa tartunnan.[4]

Lääkäreiden käymä keskustelu tehopotilaiden ja kuolleiden suhteellisen nuoresta iästä tai perussairauksien vähäisestä roolista ei siis tarkoita sitä, että tauti on jostain syystä Suomessa vaarallinen nuorelle väestölle: ehdimme yhteiskuntana pohtimaan juuri tätä kysymystä esimerkiksi terveydenhuoltojärjestelmämme romahduksen sijaan, koska olemme toistaiseksi onnistuneet vanhempien ikäluokkien suojelussa. Taudin vaarallisuus ja vaaran kohdistuminen on ymmärrettävä, jotta jatkotoimenpiteet voidaan mitoittaa oikein.


Tilaa uutiskirje ja seuraa Pandemia.fi-sivustoa Twitterissä lukeaksesi tekstit ensimmäisten joukossa.




[1] Serologinen testaus tarkoittaa epidemiologian kontekstissa vasta-aineiden määrän mittaamista verinäytteistä. "Sero-" viittaa veren seerumiin, eli veren kirkkaaseen nestemäiseen osaan, josta puuttuvat verisolut ja pääosa hyytymistekijöistä. Vasta-aineet, eli immunoglobuleenit, ovat proteiineja, jotka kehittyvät plasmasoluissa reaktiona tuntemattomiin haittatekijöihin. Ne sitoutuvat kyseessä olevaan taudinaiheuttajaan - esimerkiksi virukseen tai bakteeriin - estääkseen sen toiminnan suoraan tai välillisesti. Vasta-aineet kehittyvät haittatekijään sopivaksi - hieman kuin lukkoon sopiva avain. Jos kehossa on läsnä johonkin taudinaiheuttajaan sopivia vasta-aineita, tarkoittaa se sitä, että elimistö on kehittänyt niitä reaktiona tämän taudinaiheuttajan läsnäoloon.

[2] "99% tarkkuus" on yksinkertaistus, ja tarkoitamme tässä nimenomaan spesifiteettiä. Uteliasta lukijaa suosittelemme kääntymään Wikipedian puoleen ja tutustumaan edellä mainittuihin Gelmanin ja Srinivasanin analyyseihin.

[3] Myös valtaosassa huippujournaalien artikkeleita löytyy tilastollisia virheitä. Lääkäreiden ja kliinisen lääketieteen tutkijoiden tilastollisen päättelyn heikko laatu on suorastaan meemi, johon suhtaudutaan alalla jopa itseironialla.

[4] Helsingin Sanomien avoimesta rajapinnasta löytyy edelleen data tartuntaketjuista: https://w3qa5ydb4l.execute-api.eu-west-1.amazonaws.com/prod/finnishCoronaData. Suurin osa ensimmäisestä 100-200 tartunnoista on jäljitettävissä niihin tapauksiin, joiden "infectionSourceCountry" on "AUT" ja "ITA". Valtteri Kareston https://korona.kans.io/ näytti tämän erittäin havainnollisesti verkostograafina, joissa näki suoraan, että Suomessakin saadut tartunnat johtivat näissä maissa käyneisiin henkilöihin. Koska tartuntaketjujen jäljittämistä ei olla jatkettu, suurimmasta osasta viimeaikaisia tartuntoja tämä tieto puuttuu, eikä tästä datasta tämän vuoksi löytynyt kirjoitushetkellä hyviä visualisaatioita.

Kiitämme luonnoksen lukeneita ja sitä kommentoineita henkilöitä: Antti Lahdenperä, Tiialotta Tohmola, Pirta Hotulainen, Thomas Brand, Timo Ilomäki, Juhani Bonsdorff.

Lisää tiedettä? Olemme keränneet kaikki 8 772 tieteellistä artikkelia Covid-19:sta, rikastuttaneet listan metatiedoilla useista eri lähteistä ja mahdollistaneet listan lajittelun ja suodattamisen erilaisten laatukriteerien perusteela. Tutustu tietokantaan.