Először a régióban: szabadon kutathatók az összekötött államigazgatási adatok Magyarországon
KRTK blog

Először a régióban: szabadon kutathatók az összekötött államigazgatási adatok Magyarországon

Az államigazgatásban keletkező adatok elemi szintű feldolgozása és tudományos értelmezése elengedhetetlen a modern társadalomtudomány és a jól működő államigazgatás fejlődéséhez. A kérdéskör ritkán, elsősorban olyan kivételes helyzetekben kerül a köztudatba, amilyenek korábban a GDPR okozta átalakulások voltak, vagy jelenleg a COVID-19 járványhoz kapcsolódó adatok és számítások. Az adatok ismerete és azok tulajdoni rendszere azonban egyre nagyobb hatással van az élet szinte minden területére, ezért általában is érdemes megismerni a minket körülvevő és nyomon követő adatrendszereket.
krtk blog A HUN-REN Közgazdaság- és Regionális Tudományi Kutatóközpont blogja.

A téma különös aktualitását ezeken felül az adja, hogy a Közgazdaság- és Regionális Tudományi Kutatóközpont (KRTK) Adatbankja harmadik alkalommal hozta létre a szinte minden magyar államigazgatási nyilvántartást felölelő kutatási adatbázisát. Így ismét lehetőség nyílt arra, hogy független, etikus és szakszerű, adminisztratív adatokon nyugvó tudományos kutatások születhessenek a magyar társadalomról. Ezzel együtt lehetővé vált a korábbi adatösszekötési hullámok széleskörű tudományos felhasználása. 

Információ vagy adat

Gyakori tévhit, hogy az államigazgatásban keletkező adatok „önmagukért beszélnek”, könnyedén elemezhetők, és ehhez elég akár államigazgatási szakértők vagy más, statisztikához, adatokhoz értő szakemberek – informatikusok, matematikusok – munkája. Ez a vélekedés leginkább arra vezethető vissza, hogy az adat és az információ fogalma keveredik a köztudatban. Az adatok infrastruktúráját, tárolási módját és annak szerkezetét valóban általában informatikusok alakítják ki, és ezek a matematikai, statisztikai eszköztár segítségével elemezhetők. Seth Godin kifejezésével élve az adatok „hasznos igazsággá alakítása” azonban túlmutat ezen: megfelelő szemléletet, észlelési képességet, innovációt és betekintési képességet igényel. A hasznosság társadalmi és piaci szempontú, kreatív definiálásához és sokoldalú vizsgálatához azonban értelemszerűen társadalomtudományi és piaci szemléletre van szükség.

Magyarország az adatkultúra szempontjából korai fejlődési szakaszban jár.

A fejlődés irányát, későbbi szakaszait mutató tudásintenzív, innovációs piaci cégek és a hatékony, korszerű államigazgatási rendszerek jellemzően meghaladták már a hagyományosnak mondható, kizárólag informatika alapú adatkezelési gyakorlatot. Így az adatelemzést és az adatstruktúra kialakítását különböző szakemberek végzik, az előbbit kifejezetten adattudósok, vagy ezek csoportjai. Ezek a csoportok jellemzően többféle tudományterületet egyesítenek, így képesek összetett és multidiszciplináris kutatási kérdések vizsgálatára, illetve az ehhez szükséges, magas szintű számítási eszköztár használatára is.

Ki, miért és hogyan elemez adatot?

Az adatok gyűjtése és elemzése piaci, államigazgatási és tudományos céllal egyaránt működik a világ minden táján. A gazdaság, a politika, a tudomány és az államigazgatás erőviszonyaitól függően dinamikusan alakulnak az adatkezelés jogi keretei, az egyes területek elemzési célja és módszertana. Az államigazgatás feladatainak ellátására törekszik, ennek érdekében gyűjt adatokat és elemez saját hatáskörébe tartozó kérdéseket, jellemzően az államapparátus működtetése szempontjából szükséges témákban. A piaci és a politikai szereplők más-más motivációk miatt jellemzően belső, saját felhasználásra és pozícióik javítására igyekeznek használni az adatokat.

Ez a relatív előnyszerzés ösztönzi az adatokhoz való hozzáférés korlátozását, monopolizálását. Piaci oldalról példaként említhetők az online szolgáltatók tulajdonában lévő, piaci értéket képviselő (pl. vásárlási, keresési, megtekintési) adatok. Állami részről pedig megjelentek a különböző igazgatási nyilvántartásokban tárolt adatok közös adatbázisokba vezetésével kapcsolatos tervek. Noha ez hatékony módja lehet az államigazgatási adatfelhasználásnak, beláthatatlan következményei lehetnek abban az esetben, ha a tudományos közeg nem lát rá az adatbázisok hátterére és nem aktív résztvevője az adatfelhasználási szabályok kialakításának. Fennáll a veszélye az adatok politikai motivációjú, kizárólagos felhasználásának, ami soha nem látott visszaélésekre ad lehetőséget a gazdasági és politikai mezőben is. Bár a skandináv országokban az államigazgatás nagyban támaszkodik egyesített államigazgatási adatbázisokra, az állampolgárok témával kapcsolatos érzékenysége igen nagyfokú, mindemellett fejlett az adatkultúra és az adatetika. Ezekben a rendszerekben a tudomány, mint független adatfelhasználó, ellenőrző közeg, nagy szerepet kap az adatbázisok vizsgálatában, így mind a piaci, mind pedig a politikai felhasználás szempontjából kontrollt gyakorolhat.

A piaci és a politikai szereplők versenyhelyzetük javítása érdekében általában igyekeznek elkerülni számításaik, eredményeik nyilvános ismertetését, hiszen gazdasági előnyt, piaci értéket jelent az adat és maga a számítások módját magában foglaló technológia is. Politikai szemszögből pedig rövidtávon kedvezőnek tűnhet az információs előny, hiszen nincs mód az adat alapú kijelentések, a szakpolitikai döntések és az alapjukat jelentő számítások felülvizsgálatára.

Komoly következményei lehetnek annak, ha a külső kontrollt jelentő tudomány, mint mindkét szereplőtől független mező kevéssé jut hozzá az államigazgatásban és a piacon termelődő adatokhoz. Ez egyet jelentene a hiteles, ellenőrizhető információk közreadásának korlátozásával. Az adatalapú kutatási eredmények átlátható, jól dokumentált közlése, ellenőrizhetővé és vitathatóvá tétele ugyanis kifejezetten a tudományos mezőre jellemző gyakorlat és feladat.

A piaci vagy politikai megközelítéssel szemben a tudományos szemlélet lehetővé teszi a komplexebb, nagyobb spektrumú kutatási kérdések vizsgálatát. Emellett összegzi, fenntartja és fejleszti a piaci és szakpolitikai kutatási tevékenységek alapját is képező módszertani eszköztárat.

Magyarországon a KRTK Adatbank és a hozzá kapcsolódó kutatói közösség jelenti elsősorban azt a szakmai bázist, amely tudományos igényességgel, kutatási szempontok alapján vizsgál, tisztít és épít összekapcsolt nyilvántartás alapú adatbázisokat.

A KRTK Adatbank Kapcsolt Államigazgatási Paneladatbázisa

A KRTK Adatbank Kapcsolt Államigazgatási Paneladatbázisát röviden csak Adminként emlegeti a kutatói közösség, az egyszerűség kedvéért én is így hivatkozom rá a következőkben. A kelet-közép-európai térségben először az Adatbank hozott létre kifejezetten államigazgatási nyilvántartások tartalmát egyesítő, kutatási célú adatbázist. Az Admin társadalomtudományi jelentősége óriási, hiszen a legkülönfélébb nyilvántartások tartalmát öleli fel, így egyszerre kutatható benne szinte minden téma, ami adminisztratív adatok alapján vizsgálható. Az adatbázist tudományos körültekintéssel, közösen tisztítják az Adatbank munkatársai és a nyilvántartásokat régóta használó kutatók.

A KRTK kutatói hosszú ideje dolgoznak fontos szakpolitikai kérdések adat alapú vizsgálatán. Jelenleg az egészségtudomány, az egészségpolitika, a regionális tudományok, a munkagazdaságtan, a vállalatkutatás, a migrációkutatás, az oktatáskutatás, az agronómia és a szociálpolitika területén zajlanak kutatások az adatbázis segítségével. A fogyatékkal élők munkavállalásával, a nyugdíj egészségügyi kiadásokra gyakorolt hatásával, a börtönviseltek munkaerőpiaci helyzetével és a munkanélküli járadék változtatásaival kapcsolatban nemzetközi szempontból is fontos eredmények születtek. A legfrissebb hazai relevanciájú eredmények az iskolaköteles korhatár leszállításának következményeiről, a 10. osztályos kompetencia eredmények későbbi munkaerőpiaci hatásairól és a szakképzési reform eredményességéről számolnak be.

Az Adminban szereplő nyilvántartások tartalma egyéni szinten, ugyanakkor anonim módon van összekötve.

Ez azt jelenti, hogy 5 millió embert 15 éven keresztül havi bontásban lehet követni, anélkül, hogy személyazonosságuk közvetlenül megállapítható lenne. Az adatbázisban látható, hogy járt-e iskolába, hogyan haladt előre tanulmányaival, milyen kompetenciateszt-eredményeket ért el. Később látjuk idősebbként a munkaerőpiacon, kiderül, mit és hol dolgozik, kik a kollégái, mennyit keres, mikor megy táppénzre, mikor lép ki a munkahelyéről vagy megy nyugdíjba. Képet kaphatunk arról is, hogy aki éppen nem dolgozik, kap-e valamilyen jóléti transzfert, regisztrálták-e munkanélküliként. Emellett vannak adataink az egészségi állapotra vonatkozóan is.

Az egyéni adatok védelme

Az adatok összekapcsolása egy minden nyilvántartó számára ismeretlen, rejtett hash-algoritmus segítségével történik. A hash eljárás arra szolgál, hogy az adatforrást jelentő nyilvántartásokban szereplő egyéni azonosítókat (például ilyen a TAJ-szám) eltorzítsa. Így az adott egyénhez kapcsolódó, különféle regiszterekből származó információkat egyértelműen egymáshoz lehet rendelni, ugyanakkor az adatokat nem lehet azonosító alapján konkrét személyekhez kötni.

A felfedési kockázat további csökkentése érdekében az összekötést végző szerv (Nemzeti Infokommunikációs Szolgáltató Zrt.) anonimizál is. Ennek során a különlegesnek számító, kritikusan alacsony számú eseteket tartalmazó kategóriákat (pl. különböző betegségek kódjait, iskolai végzettségeket) összevonja. Emellett az egyéni adatok védelme érdekében a KRTK Adatbank csupán biztonságos és zárt szerverkörnyezetben engedi kutatni az Admint, kizárólag tudományos háttérintézet által megbízott, vagy megfelelő és ellenőrizhető tudományos célkitűzéssel rendelkező kutatók és szakdolgozók számára.

Az egyéni adatok szakszerű védelme és a tudományetikai kritériumok közösen nyújtanak védelmet a felfedési kockázat ellen. Ezzel szemben a piaci és politikai térben kétségesebb az egyéni adatok korrekt és etikus felhasználása, hiszen ott a tudományos működésből adódó ellenőrzési garanciák nem megoldhatók.

Az ellenőrizhető adathasználatra különös figyelmet fordító, tudományterületeken átívelő, független, adatalapú társadalomkutatási gyakorlat szükséges a szakpolitikák kidolgozásához, jól működő tudományos és államigazgatási szféra kialakításához, valamint az élet összes területére alkalmazható adatetikai irányelvek kidolgozásához.

Az Adminról ebben a cikkben lehet részletesen olvasni.

A szerző a Közgazdaság- és Regionális Tudományi Kutatóközpont Közgazdaságtudományi Intézetének munkatársa.

A vendégszerzőink írásai a szerzők véleményét tükrözik, és azok nem feltétlenül esnek egybe a Portfolio álláspontjával. 

 
MNB Intézet

A szignifikanciatesztelés logikája

Egy viselkedéses közgazdaságtan területén végzett kutatás során arra voltak kíváncsiak a kutatók, hogy a reptéri piszoárok belsejébe ragasztott legyet ábrázoló matrica növeli-e annak az e

GDPR

Nagy nyelvi modellek és adatvédelem

Az elmúlt bő másfél évben, mióta a ChatGPT széles körben elérhetővé vált, a nagy nyelvi modelleken (Large Language Model, LLM) alapuló megoldások hihetetlen tempóban váltak mind a munkahely

Kiszámoló

Olajkrízis várható Magyarországon?

Egy múlt heti hír nem annyira bolygatta fel az ország közvéleményét, mint kellett volna. Az ukránok megtiltották a Lukoilnak, hogy Ukrajnán keresztül szállítsák a kőolajat Európába. Az ukr

Holdblog

Mi az értelmetlen befektetés?

Értelmetlen befektetés az, ami a dráguláson kívül semmire sem képes? Vagy önmagában a drágulás tényétől máris nem lehet az? Egyik olvasónk vendégcikkben elmélkedik arról, lehet-e... The

Holdblog

Egyre kevesebb emberre számítanak

Azt sem tudjuk pontosan, hány ember él a Földön, pláne nehéz megbecsülni, hányan fognak száz év múlva. Az ENSZ azért pár évente megteszi, a jelen... The post Egyre kevesebb emberre számítan

FRISS HÍREK
NÉPSZERŰ
Összes friss hír
Európa legrosszabb rémálma válhat valóra Donald Trumppal – Tényleg Kamala Harris maradt a kontinens utolsó reménysége?
Díjmentes előadás

Kereskedés a magyar piacon kezdőknek

Minden, amit a hazai parkettre lépés előtt tudni érdemes.

Díjmentes előadás

Tőzsdei megbízások helyes használata

Kérdések és válaszok azzal kapcsolatban, hogy mire figyelj, ha kezdő befektető vagy!

Portfolio hírlevél

Ne maradjon le a friss hírekről!

Iratkozzon fel megújult, mobilbaráthírleveleinkre és járjon mindenki előtt.

Infostart.hu Infostart.hu

Ügyvédek

A legjobb ügyvédek egy helyen

Sustainable World 2024
2024. szeptember 4.
Követeléskezelési trendek 2024
2024. szeptember 18.
REA 2024 SUMMIT – Powered by Pénzcentrum
2024. szeptember 18.
Budapest Economic Forum 2024
2024. október 17.
Hírek, eseményajánlók első kézből: iratkozzon fel exkluzív rendezvényértesítőnkre!
Ez is érdekelhet
online vásárlás