adatbazis
KRTK blog

Először a régióban: szabadon kutathatók az összekötött államigazgatási adatok Magyarországon

Sebők Anna, KRTK KTI
Az államigazgatásban keletkező adatok elemi szintű feldolgozása és tudományos értelmezése elengedhetetlen a modern társadalomtudomány és a jól működő államigazgatás fejlődéséhez. A kérdéskör ritkán, elsősorban olyan kivételes helyzetekben kerül a köztudatba, amilyenek korábban a GDPR okozta átalakulások voltak, vagy jelenleg a COVID-19 járványhoz kapcsolódó adatok és számítások. Az adatok ismerete és azok tulajdoni rendszere azonban egyre nagyobb hatással van az élet szinte minden területére, ezért általában is érdemes megismerni a minket körülvevő és nyomon követő adatrendszereket.

A téma különös aktualitását ezeken felül az adja, hogy a Közgazdaság- és Regionális Tudományi Kutatóközpont (KRTK) Adatbankja harmadik alkalommal hozta létre a szinte minden magyar államigazgatási nyilvántartást felölelő kutatási adatbázisát. Így ismét lehetőség nyílt arra, hogy független, etikus és szakszerű, adminisztratív adatokon nyugvó tudományos kutatások születhessenek a magyar társadalomról. Ezzel együtt lehetővé vált a korábbi adatösszekötési hullámok széleskörű tudományos felhasználása. 

Információ vagy adat

Gyakori tévhit, hogy az államigazgatásban keletkező adatok „önmagukért beszélnek”, könnyedén elemezhetők, és ehhez elég akár államigazgatási szakértők vagy más, statisztikához, adatokhoz értő szakemberek – informatikusok, matematikusok – munkája. Ez a vélekedés leginkább arra vezethető vissza, hogy az adat és az információ fogalma keveredik a köztudatban. Az adatok infrastruktúráját, tárolási módját és annak szerkezetét valóban általában informatikusok alakítják ki, és ezek a matematikai, statisztikai eszköztár segítségével elemezhetők. Seth Godin kifejezésével élve az adatok „hasznos igazsággá alakítása” azonban túlmutat ezen: megfelelő szemléletet, észlelési képességet, innovációt és betekintési képességet igényel. A hasznosság társadalmi és piaci szempontú, kreatív definiálásához és sokoldalú vizsgálatához azonban értelemszerűen társadalomtudományi és piaci szemléletre van szükség.

Magyarország az adatkultúra szempontjából korai fejlődési szakaszban jár.

A fejlődés irányát, későbbi szakaszait mutató tudásintenzív, innovációs piaci cégek és a hatékony, korszerű államigazgatási rendszerek jellemzően meghaladták már a hagyományosnak mondható, kizárólag informatika alapú adatkezelési gyakorlatot. Így az adatelemzést és az adatstruktúra kialakítását különböző szakemberek végzik, az előbbit kifejezetten adattudósok, vagy ezek csoportjai. Ezek a csoportok jellemzően többféle tudományterületet egyesítenek, így képesek összetett és multidiszciplináris kutatási kérdések vizsgálatára, illetve az ehhez szükséges, magas szintű számítási eszköztár használatára is.

Ki, miért és hogyan elemez adatot?

Az adatok gyűjtése és elemzése piaci, államigazgatási és tudományos céllal egyaránt működik a világ minden táján. A gazdaság, a politika, a tudomány és az államigazgatás erőviszonyaitól függően dinamikusan alakulnak az adatkezelés jogi keretei, az egyes területek elemzési célja és módszertana. Az államigazgatás feladatainak ellátására törekszik, ennek érdekében gyűjt adatokat és elemez saját hatáskörébe tartozó kérdéseket, jellemzően az államapparátus működtetése szempontjából szükséges témákban. A piaci és a politikai szereplők más-más motivációk miatt jellemzően belső, saját felhasználásra és pozícióik javítására igyekeznek használni az adatokat.

Ez a relatív előnyszerzés ösztönzi az adatokhoz való hozzáférés korlátozását, monopolizálását. Piaci oldalról példaként említhetők az online szolgáltatók tulajdonában lévő, piaci értéket képviselő (pl. vásárlási, keresési, megtekintési) adatok. Állami részről pedig megjelentek a különböző igazgatási nyilvántartásokban tárolt adatok közös adatbázisokba vezetésével kapcsolatos tervek. Noha ez hatékony módja lehet az államigazgatási adatfelhasználásnak, beláthatatlan következményei lehetnek abban az esetben, ha a tudományos közeg nem lát rá az adatbázisok hátterére és nem aktív résztvevője az adatfelhasználási szabályok kialakításának. Fennáll a veszélye az adatok politikai motivációjú, kizárólagos felhasználásának, ami soha nem látott visszaélésekre ad lehetőséget a gazdasági és politikai mezőben is. Bár a skandináv országokban az államigazgatás nagyban támaszkodik egyesített államigazgatási adatbázisokra, az állampolgárok témával kapcsolatos érzékenysége igen nagyfokú, mindemellett fejlett az adatkultúra és az adatetika. Ezekben a rendszerekben a tudomány, mint független adatfelhasználó, ellenőrző közeg, nagy szerepet kap az adatbázisok vizsgálatában, így mind a piaci, mind pedig a politikai felhasználás szempontjából kontrollt gyakorolhat.

A piaci és a politikai szereplők versenyhelyzetük javítása érdekében általában igyekeznek elkerülni számításaik, eredményeik nyilvános ismertetését, hiszen gazdasági előnyt, piaci értéket jelent az adat és maga a számítások módját magában foglaló technológia is. Politikai szemszögből pedig rövidtávon kedvezőnek tűnhet az információs előny, hiszen nincs mód az adat alapú kijelentések, a szakpolitikai döntések és az alapjukat jelentő számítások felülvizsgálatára.

Komoly következményei lehetnek annak, ha a külső kontrollt jelentő tudomány, mint mindkét szereplőtől független mező kevéssé jut hozzá az államigazgatásban és a piacon termelődő adatokhoz. Ez egyet jelentene a hiteles, ellenőrizhető információk közreadásának korlátozásával. Az adatalapú kutatási eredmények átlátható, jól dokumentált közlése, ellenőrizhetővé és vitathatóvá tétele ugyanis kifejezetten a tudományos mezőre jellemző gyakorlat és feladat.

A piaci vagy politikai megközelítéssel szemben a tudományos szemlélet lehetővé teszi a komplexebb, nagyobb spektrumú kutatási kérdések vizsgálatát. Emellett összegzi, fenntartja és fejleszti a piaci és szakpolitikai kutatási tevékenységek alapját is képező módszertani eszköztárat.

Magyarországon a KRTK Adatbank és a hozzá kapcsolódó kutatói közösség jelenti elsősorban azt a szakmai bázist, amely tudományos igényességgel, kutatási szempontok alapján vizsgál, tisztít és épít összekapcsolt nyilvántartás alapú adatbázisokat.

A KRTK Adatbank Kapcsolt Államigazgatási Paneladatbázisa

A KRTK Adatbank Kapcsolt Államigazgatási Paneladatbázisát röviden csak Adminként emlegeti a kutatói közösség, az egyszerűség kedvéért én is így hivatkozom rá a következőkben. A kelet-közép-európai térségben először az Adatbank hozott létre kifejezetten államigazgatási nyilvántartások tartalmát egyesítő, kutatási célú adatbázist. Az Admin társadalomtudományi jelentősége óriási, hiszen a legkülönfélébb nyilvántartások tartalmát öleli fel, így egyszerre kutatható benne szinte minden téma, ami adminisztratív adatok alapján vizsgálható. Az adatbázist tudományos körültekintéssel, közösen tisztítják az Adatbank munkatársai és a nyilvántartásokat régóta használó kutatók.

A KRTK kutatói hosszú ideje dolgoznak fontos szakpolitikai kérdések adat alapú vizsgálatán. Jelenleg az egészségtudomány, az egészségpolitika, a regionális tudományok, a munkagazdaságtan, a vállalatkutatás, a migrációkutatás, az oktatáskutatás, az agronómia és a szociálpolitika területén zajlanak kutatások az adatbázis segítségével. A fogyatékkal élők munkavállalásával, a nyugdíj egészségügyi kiadásokra gyakorolt hatásával, a börtönviseltek munkaerőpiaci helyzetével és a munkanélküli járadék változtatásaival kapcsolatban nemzetközi szempontból is fontos eredmények születtek. A legfrissebb hazai relevanciájú eredmények az iskolaköteles korhatár leszállításának következményeiről, a 10. osztályos kompetencia eredmények későbbi munkaerőpiaci hatásairól és a szakképzési reform eredményességéről számolnak be.

Az Adminban szereplő nyilvántartások tartalma egyéni szinten, ugyanakkor anonim módon van összekötve.

Ez azt jelenti, hogy 5 millió embert 15 éven keresztül havi bontásban lehet követni, anélkül, hogy személyazonosságuk közvetlenül megállapítható lenne. Az adatbázisban látható, hogy járt-e iskolába, hogyan haladt előre tanulmányaival, milyen kompetenciateszt-eredményeket ért el. Később látjuk idősebbként a munkaerőpiacon, kiderül, mit és hol dolgozik, kik a kollégái, mennyit keres, mikor megy táppénzre, mikor lép ki a munkahelyéről vagy megy nyugdíjba. Képet kaphatunk arról is, hogy aki éppen nem dolgozik, kap-e valamilyen jóléti transzfert, regisztrálták-e munkanélküliként. Emellett vannak adataink az egészségi állapotra vonatkozóan is.

Az egyéni adatok védelme

Az adatok összekapcsolása egy minden nyilvántartó számára ismeretlen, rejtett hash-algoritmus segítségével történik. A hash eljárás arra szolgál, hogy az adatforrást jelentő nyilvántartásokban szereplő egyéni azonosítókat (például ilyen a TAJ-szám) eltorzítsa. Így az adott egyénhez kapcsolódó, különféle regiszterekből származó információkat egyértelműen egymáshoz lehet rendelni, ugyanakkor az adatokat nem lehet azonosító alapján konkrét személyekhez kötni.

A felfedési kockázat további csökkentése érdekében az összekötést végző szerv (Nemzeti Infokommunikációs Szolgáltató Zrt.) anonimizál is. Ennek során a különlegesnek számító, kritikusan alacsony számú eseteket tartalmazó kategóriákat (pl. különböző betegségek kódjait, iskolai végzettségeket) összevonja. Emellett az egyéni adatok védelme érdekében a KRTK Adatbank csupán biztonságos és zárt szerverkörnyezetben engedi kutatni az Admint, kizárólag tudományos háttérintézet által megbízott, vagy megfelelő és ellenőrizhető tudományos célkitűzéssel rendelkező kutatók és szakdolgozók számára.

Az egyéni adatok szakszerű védelme és a tudományetikai kritériumok közösen nyújtanak védelmet a felfedési kockázat ellen. Ezzel szemben a piaci és politikai térben kétségesebb az egyéni adatok korrekt és etikus felhasználása, hiszen ott a tudományos működésből adódó ellenőrzési garanciák nem megoldhatók.

Az ellenőrizhető adathasználatra különös figyelmet fordító, tudományterületeken átívelő, független, adatalapú társadalomkutatási gyakorlat szükséges a szakpolitikák kidolgozásához, jól működő tudományos és államigazgatási szféra kialakításához, valamint az élet összes területére alkalmazható adatetikai irányelvek kidolgozásához.

Az Adminról ebben a cikkben lehet részletesen olvasni.

A szerző a Közgazdaság- és Regionális Tudományi Kutatóközpont Közgazdaságtudományi Intézetének munkatársa.

A vendégszerzőink írásai a szerzők véleményét tükrözik, és azok nem feltétlenül esnek egybe a Portfolio álláspontjával. 

 
Bahmut katona
bull bear
zöld épületek
2023. április 12.
DEBRECEN - Pörgessük fel együtt a hazai KKV szektort!
2023. május 17.
Portfolio-MAGE Járműipar 2023
2023. május 10.
Gen Z Fest 2023
2023. április 25.
Sustainable Tech 2023
Hírek, eseményajánlók első kézből: iratkozzon fel exkluzív rendezvényértesítőnkre!
Portfolio hírlevél
Ne maradjon le a friss hírekről!
Iratkozzon fel megújult, mobilbarát
hírleveleinkre és járjon mindenki előtt.

Ügyvédek

A legjobb ügyvédek egy helyen

Infostart.hu
Online kurzus
Akár 100 000 Ft-tal elkezdhető, hosszú távú megtakarítási módszer.
Díjmentes online előadás
Hogyan csináld a gyakorlatban?
Ez is érdekelhet
pf_miskolc