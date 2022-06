Egy friss hazai kutatás a koronavírus-járvány halálozási adatait elemezte járási szinten. Kovács László és Vántus Katalin cikke egy szerintem is rendkívül fontos feladatot próbál megoldani: feltárni a halálozást befolyásoló okokat. Válaszcikkemben bemutatom, hogy véleményem szerint mi az erőssége a módszerüknek, és mik azok a problémák, amik miatt mégsem olyan egyszerű az eredmények értelmezése. Nagyon sok megoldandó kérdés van, de ezeken való közös gondolkodás visz minket közelebb a megfelelő következtetések levonásához, ami lehetővé teszi a helyzet jövőbeli javítását.

Nagy örömmel olvastam Kovács László és Vántus Katalin cikkét a Területi Statisztikában, illetve az arról a Portfolion megjelent szemlét. Az örömöm annak is szól, hogy ez a cikk nem az első ebben a sorban, márpedig személyes meggyőződésem, hogy az ilyen jellegű elemzések, a hazai koronavírusos halálozások mögött fellelhető okok, mélyben fekvő tényezők, a járványkezelés erényeinek és hibáinak feltárása erős eszközünk a lakosság egészségének, a népegészségügy állapotának javítására. E társadalmi diskurzusnak úgy gondolom alapvető fontosságú része a kutatások kritikája és megerősítése, árnyalása, értékelése, továbbgondolása, egyszóval: a nyílt és őszinte eszmecsere és diszkusszió; ez teszi lehetővé a legjobb eredmények elérését. Ennek jegyében élnék hozzászólással a fenti cikk kapcsán.

Először is kezdeném Kovács és Vántus cikkének két alapvető fontosságú pozitívumával. Azért emelném ki ezeket és kommentálnám külön is, mert úgy gondolom példaadóak lehetnek minden hasonló kutatás számára is. Az egyik a területi (járási szintű) elemzések használata. A hangsúlyom itt nem is konkrétan a területi elemzésen van, hanem a trükk használatán – hogyan tudjuk meghatározni, hogy milyen tényezők hatnak a halálozásra, ha csak egy ország adatait használjuk? Szeretném kiemelni, hogy ez nem egy nyilvánvaló probléma, sőt, elsőre akár azt is gondolhatnánk, hogy megoldhatatlan: az országnak van egy munkanélkülisége, egy ápoló-ellátottsága, egy korfája stb. meg egy halálozási adata, hogyan tudnánk akkor megmondani, hogy az ápolók számának növekedtével mi lett volna a halálozási aránnyal?! Itt jön Kovács és Vántus ötlete: nézzük az országot járási szinten! Hiszen ott már van szóródás a munkanélküliségben, az ápolók számában, a korfában, hasonlóan a kimenetként vizsgált halálozási arányban, ezek mind eltérnek az egyes járásokban, így ezek összevetéséből már kaphatunk értelmes megállapítást, egyetlen ország adatait használva is! Sok más megoldást is végig lehetne gondolni, és ismétlem, én sem magát a területi elemzést szeretném kiemelni, hanem azt, hogy ügyes észrevételekkel hogyan tudunk nehéznek tűnő helyzetben is eredményekhez jutni. Ez annál is inkább fontos, mert a témakör – milyen tényezők hatnak a halálozások számára – rendkívül nehéz módszertani problémákkal terhelt; mindezeket egy korábbi írásomban magam is bemutattam.

Mindazonáltal minden esetben fontos, bármilyen megoldással is élünk, a limitációk végiggondolása. A finom felbontású területi elemzéseknél ilyen a területi adatok kérdése.

Példának okáért, Kovács és Vántus tanulmányában lényeges elemként jelenik meg az „ápolók száma”, ám fontos hangsúlyozni, hogy ez a háziorvosi szolgálathoz tartozó ápolók számát jelenti! Teljesen világos, hogy a halálozás szempontjából ezerszer relevánsabb lenne a kórházi (és akár külön az intenzív osztályos) ápolók és szakápolók számát alapul venni, csakhogy itt belefutunk egy problémába: egyrészt járási szinten nézve ez egy sor esetben nulla lesz, mert nincs is kórház – pláne intenzív osztály – az adott járásban, másrészt a magyar egészségügyi ellátórendszer szervezése nem értelmezhető tisztán járási szinten (sőt), azaz ahol meg nem nulla, ott sem lehet csak az adott járás lakosságára ráosztani a számukat, mert más járásbeli lakosokat is el fognak látni a kórházban. Azaz azt látjuk, hogy itt nem egyszerűen adatelérhetőségi vagy adatminőségi kérdés van, hanem egy sokkal alapvetőbb probléma: értelmezhető-e egyáltalán az adott változó járási szinten? Az ilyen és ehhez hasonló dilemmák sokszor feloldhatatlanok, mégis, azt gondolom, hogy sok esetben pusztán a végiggondolásuk is sokat segít. Ügyes trükkök ide vagy oda, varázsmegoldások általában nincsenek, csak lassú araszolás a jobb válaszok irányába – de ezeket pont az ilyen tapogatózások tesznek lehetővé! (Az embernek eszébe jut amit Liska Tibor írt az Ökonosztátban: „A gazdasági életben nincs happy end, csak a mind magasabb rendű, kevésbé elvtelen kompromisszumok irányába való fejlődés”…)

A másik elem, ami véleményem szerint kieemelendő, mint követendő példa: a formális statisztikai eszközök alkalmazása. Számos csapda és buktató kötődik ahhoz, ha az ember naiv eszközökkel (például egyszerűen összekorreláltva a halálozások számát az ápolók számával), pláne, ha „érzésre”, benyomások alapján próbál válaszolni a kérdésekre. Népegészségügyi megállapítást csak jól validált, elméletben és gyakorlatban is alaposan kiismert biostatisztikai elemzési eszközöket használva tehetünk, olyanokat, melyek transzparensek, bárki számára megismerhetőek, az elemzési folyamatuk reprodukálható. A regresszió, amit Kovács és Vántus használt, ilyen eszköz; elemzésük igen alapos.

Mindezen nagyon pozitív, és reményeim szerint a későbbi tanulmányokban is követőkre találó erények mellett több fenntartásom is van.

E helyütt nem statisztikai részletekről szeretnék szólni, hanem egy minden elemzést érintő kérdéskörről, ami a cikkben egy mondat erejéig sem jelent meg, miközben véleményem szerint alapvetően színezi át az eredmények értékelését.

A probléma a halálozási arány definíciója. Ez látszólag nyilvánvaló: halottak száma osztva a fertőzöttek számával; a szerzők is ezt használják a tanulmányban. A halottak száma kapcsán is felvethetőek kérdések, melyről magam is írtam korábban, ám most nem erre szeretnék fókuszálni, hanem a nevezőre. Kovács és Vántus ezt konzisztensen „fertőzöttek száma” néven emlegeti, csak sajnos ez nem helyes: amit használnak, az valójában nem a fertőzöttek, hanem a detektált fertőzöttek (azaz a jelentett esetek) száma. A kettő azonban nagyon nem ugyanaz: ennél a betegségnél nem elhanyagolható arányban vannak tünetmentes, vagy enyhe, más betegséggel könnyen összetéveszthető tüneteket mutató fertőzöttek. Előbbieket kizárólag, utóbbiakat elsősorban teszttel lehet megtalálni, és innentől látszik a probléma: a detektált fertőzöttek száma drasztikusan függeni fog a tesztelés intenzitásától! Ahol többet tesztelnek, ott – rögzített valódi fertőzött-szám mellett is – több lesz a jelentett eset, ahol kevesebbet, ott kevesebb.

Ha ez egy fix arány lenne, például minden második valódi fertőzöttet találjuk meg, az még a kisebb gond volna. Igen, a járás valódi halálozási aránya ez esetben az általunk számolt fele lenne, de a dolog az összehasonlíthatóságot nem befolyásolja, hiszen a többi járás adata is pont ugyanennyivel fog eltérni. Azaz épp a szerzők vizsgálatánál, ahol a ráható tényezőket elemzik, nem jelentkezne torzítás.

Az igazi probléma ott kezdődik, hogy a tesztelési intenzitás nem egy fix érték, de a még nagyobb baj, hogy az, hogy hol nagyobb és hol kisebb, messzemenőkig nem véletlen: egyrészt függ a tesztelési stratégiától (kiket tesztelünk: a kicsit gyanús eseteket is? csak az egyértelműen gyanús eseteket? vagy fordítva, akár tünetmenteseket is?), az alkalmazott tesztek típusától, arányától, másrészt függ a teszt elérhetőségététől, a lakosok egészségtudatosságától, anyagi lehetőségeitől, egyszóval erős összefüggést mutat a szocioökonómiai státusszal. Ráadásul a valóságban még egy harmadik effektus is van: az, hogy a tünetmentesség aránya maga sem állandó, például az életkor növekedtével ritkábbá válik, tehát a korfa is számít: az idősebb járásokban még azonos tesztelési intenzitás mellett is nagyobb lesz a felderítési arány. És ezek viszont már drámai problémák, a szerzők célja szempontjából is, ugyanis ezek meg – elképzelhető, hogy mindhárom tényező, de a második és harmadik egész biztosan – összefüggenek a járással, amit ők elemeznek!

Ahol jobb a szocioökonómiai helyzet, ott több tesztet végeznek, ez több enyhe tünetes vagy tünetmentes esetet fedez fel és rak a nevezőbe, ez leviszi a halálozási arányt,

még akkor is, ha a valódi értéke nem olyan jó – csakhogy Kovács-Vántus módszere ebből azt fogja kimutatni, hogy a szocioökonómiai státusz javított a halálozási arányon! Miközben lehet, hogy annak valójában semmi jelentősége nincsen, csak a több teszt vitte le az arányt! Sőt, elvileg akár még az is elképzelhető, hogy a szocioökonómiai helyzet maga rontott a halálozási arányon, csak a több teszt javító hatása nagyobb volt. Meg persze az is lehet, hogy teljesen igazuk van, tényleg ront (de az általuk kimutatott hatás ekkor is torzítottan nagyobb lesz a valósághoz képest!). Ez nem csak elméleti aggodalom, hanem konkrét probléma, ugyanis Kovács és Vántus modelljében szerepel a munkanélküliség. Ez más szempontból jó hír, erre még később visszatérek, de az szinte garantálható, hogy az erre kapott becslés masszívan felfelé torzított, és nem értelmezhető úgy, ahogy a cikkben és a szemléjében megjelent, tehát egyszerűen mint az egészségi állapot hatása. Ez valójában az egészségi állapot és a több teszt – ismeretlen arányú – együttes hatása.

A problémát – angol rövidítésekkel élve – a CFR és az IFR keveredése jelenti. Az előbbit használjuk akkor, ha a halottak számát a detektált fertőzöttek számával osztjuk el (case fatality ratio), az utóbbit akkor, ha a fertőzöttök valódi számával (infection fatality ratio); most tegyük egy pillanatra félre azt a problémát, hogy ez utóbbit honnan tudjuk. A CFR a felvázolt okból kifolyólag önmagában szinte haszontalan: aligha mond bármit a betegség tényleges (biológiai) kockázatáról egy olyan szám, amit befolyásol az, hogy hány forintba kerül egy teszt… Bármilyen elemzéshez az IFR-t kell alapul venni! A CFR-t legfeljebb annyiban, amennyire az IFR-t közelíti (például egységesen intenzív tesztelésnél).

Ez az, ami nem valósult Kovács és Vántus tanulmányában. Azt is vegyük persze figyelembe, hogy itt nem arról van szó, hogy miért nem egy másik adatsort töltöttek le: pont az a probléma, hogy az IFR egy nem megfigyelhető változó! Hiszen épp az volt a baj, hogy mi magunk sem tudhatjuk, hogy hány tényleges fertőzött van. Ezen lehet segíteni olyan vizsgálatokkal, amelyek a vérben keresik a fertőzöttségen átesés immunológiai jeleit; ilyen adatokból, nem feltétlenül egyszerű matematikai módszereket használva, de rekonstruálható a valódi fertőzöttek száma. (Ez az ún. szerológia nem tökéletesen pontos, és a védőoltások is megbonyolítják a képet.) Magyarországon 2020 nyarán készült egy ilyen vizsgálat, utána több már nem, de a mostani kérdésünk szempontjából mindegy is, mert járási szintű adat abból sem származott.

Mindez rámutat egy nagyon fontos általános tanulságra is: a statisztikai eszközök ismerete önmagában nem elégséges, rendelkezni kell az adott konkrét jelenséghez kötődő, tárgyterületi szakmai ismeretekkel is, hogy elkerüljük az ilyen buktatókat.

Hogy konstruktívak legyünk, zárásként tegyük fel a kézenfekvő kérdést: mit tehetünk? Hogyan lehetne ezt jobban csinálni? Élhetünk például egy alsó korlát jellegű közelítéssel: ha a lakosságszámhoz, és nem a – bárhogy is definiált – fertőzött-számhoz viszonyítjuk a halálozást, akkor megkapjuk az IFR minimumát. (Hiszen mi az IFR? Halott per tényleges fertőzött. Adott számú halott mellett ez akkor minimális, ha a szám amivel osztunk a lehető legnagyobb, márpedig annak a maximuma a teljes lakosságszám. Magyarán: ennyi lenne az IFR akkor, ha mindenki átesett volna a fertőzésen. Ha valójában kevesebben estek át, akkor, mivel kisebb számmal osztunk, csak nagyobb lehet az IFR.) Nem véletlen, hogy sok tanulmány ezt, tehát a népességre vetített halálozás-számot használja a helyzet jellemzésére; más kérdés, hogy ez egybe fogja mérni a megfertőződési helyzetet (hányan fertőződnek meg) és a fertőzöttek gyógyulási kilátásait (a megfertőződöttek milyen arányban halnak meg). Hogy ez jó-e, az az elemzési céltól függ, ha például a járvány terhe érdekel minket, és azt halálozással mérjük, akkor pont hogy ez lesz a jó mutató. Elvi szinten is, nem csak adatelérhetőségi kényszer okán! Ha mégis a gyógyulási arányt akarjuk izoláltan vizsgálni, akkor van egy statisztikai megoldás is: ha a tesztelési intenzitást nem is ismerjük, használjunk valamilyen gazdasági fejlettségi indikátort annak helyettesítésére! Ebben az esetben az arra kapott eredmény ugyan fals lesz, ezt korábban már említett is, hiszen benne lesz a több teszt hatása is, de cserében segíthet a többi eredmény helyes értékre beállításában, mivel azok onnantól már úgy lesznek értendőek, hogy plusz egy ápoló mennyit számít, ha a gazdasági fejlettség állandó, rögzített értékű – és így, reményeink szerint, a tesztelési intenzitás is állandó. (Ha nem is tudatosan, de Kovács-Vántus lehet, hogy épp ezt tette, mert használták a munkanélküliséget; az persze egy empirikusan vizsgálandó kérdés, hogy a munkanélküliség mennyire jó helyettesítője a tesztelési aktivitásnak.) Felmerül persze a kérdés, hogy miért nem használjuk magukat a tesztelési intenzitási adatokat? Ilyen adatok nyilvánosan sajnos nem érhetőek el járási szinten, de még ha ettől el is tekintünk, akkor is óvatosnak kell lenni: a tesztek darabszáma valóban jól jelzi a felderített fertőzések arányát? Kétségtelenül a talán legjobb megoldásnak ez tűnik, de azért egy pici óvatosság itt is indokolt: számít a tesztelési mintázat is! Ha elvégzünk plusz ezer tesztet, nem mindegy, hogy azokkal nagyon gyanús tüneteket mutató, épp kórházba felvett betegeket tesztelünk le, vagy egyébként makkegészséges munkába érkező embereket, akiknél a munkaadó pont egy szűrési programot hajtott végre.

Ha valaki úgy érzi, hogy ezek a gondolatok több kérdést vetettek fel, mint amennyit megválaszoltak, az nem véletlen – de azt hiszem e kérdések megválaszolásával lehet haladni a korábban említett jobb válaszok irányába.

