A Benford-szabály egy széles körben elfogadott módszer arra, hogy a hétköznapi élet során előforduló számok eredetiségét teszteljük. Nagy, több nagyságrenden átívelő, vagy sokféle különböző forrásból származó adatok esetében a kezdő számjegyek nagyobb valószínűséggel vesznek fel kicsi értéket, mint nagyot. A tízes számrendszer esetében például az következik a Benford-szabály alkalmazásából, hogy az 1-essel kezdődő számok előfordulási valószínűsége durván 30% körül van, míg a 9-esé már az 5%-ot sem éri el.
Hangsúlyozandó, hogy természetes, emberek által nem manipulált számok esetében.
Hogy ez a megállapítás egész pontosan hogyan szól, ki találta ki, és miért érvényesül a világban, arról ebben a cikkünkben írtunk korábban. Az alábbiakban pedig most a Benford-szabály egy különösen releváns alkalmazásáról fogunk beszámolni: a hivatalos COVID-esetszámok megbízhatóságáról.
Mit mond Benford?
Egy nemrég megjelent kutatás (Anran Wei és Andre E. Vellwock munkája) ugyanis annak eredt utána, hogy vajon látszik-e bármiféle manipuláció az egyes országok által közölt COVID-esetszámokban. A kutatók négyféle adathalmazt vettek alapul: a napi és a teljes megerősített esetszámokat, illetve ugyanezen két nézetben a halálozási számokat.
A COVID-19 adatok a CSSE-től származnak (Center for Systems Science and Engineering, Johns Hopkins University), és a 2020. szeptember 1-ig terjedő időszakot fedik le. A regionális bontásban szereplő adatokat országszinten összeadták, ugyanis a Benford-szabály vizsgálata szempontjából a minél nagyobb megfigyelésszám elérésére kell törekedni.
Itt viszont máris megjegyzendő, hogy Kína esete nehezen elemezhető, mert a hivatalos statisztikák szerint náluk igencsak hamar stabilizálódott a helyzet, és emiatt nincs elegendő megfigyelés. A kutatók ezért Kína esetében úgy döntöttek, hogy mégis szerencsésebb az esetszámokat régiós szinten vizsgálni, hogy ezzel is növeljék a megfigyelések számát.
A Benford-szabály szerint a megfigyelésekben a vezető számjegyek a következő gyakorisággal kellene, hogy előforduljanak:

Hangsúlyozandó ugyanakkor, hogy pusztán az elméleti megoszlástól való eltérés még nem jelenti azt, hogy a számokat manipulálták volna. Érdemes emiatt a vizsgálatot olyan módon elvégezni, hogy meghatározunk egy kritikus értéket vagy egy statisztikai szignifikancia szintet, ami alapján elfogadjuk, hogy egy-egy adathalmaz megfelel-e a Benford-szabálynak. A kutatók jelen esetben William Goodman munkájára hagyatkozva a 25%-nál nagyobb normalizált négyzetes eltérés esetén (d-faktor) tekintették manipuláltnak az adatokat.
Gyanús eredmények
A kutatók fő megállapítása, hogy a COVID-19 esetszámai általában megfelelnek a Benford-szabálynak, vagyis az első számjegyek gyakoriságai hasonlóan oszlanak meg, mint az az elméletből következne. Az összes országon elvégzett mérések szerint a d-faktor pusztán 3%, vagyis nagyon közel van a várt értékhez.
Ezt követően a kutatók sorra vették az olyan országokat, ahol kellően nagyok az esetszámok ahhoz, hogy a vizsgálat megfelelően elvégezhető legyen. Következtetéseik szerint nem látszik nyoma adatmanipulációnak a legtöbb vizsgált országnál, mint amilyen az USA, Brazília, India, Peru, vagy éppen a Dél-afrikai Köztársaság.
A kutatók főbb eredményeit és a Benford-szabály illeszkedését az adatokon (a d-faktor átlagos értékeivel) az alábbi ábrán láthatjuk:

Két gyanús eset egyértelműen felmerült: Oroszország és Irán. Ezen autokrata rezsimek COVID-számai a fenti vizsgálatban igen furcsa eltéréseket produkáltak. Irán esetében például a 2-es számnál van egy nehezen magyarázható kiugrás a napi számokban, ami 42 százalékos d-faktort eredményez. De az összesített számokban már mégis úgy tűnik, hogy megfelelnek a Benford-szabálynak. Az eredmény esetükben ezért nem teljesen egyértelmű.
Oroszország ebből a szempontból jóval érdekesebb, ugyanis náluk a teljes esetszám növekedése sem követi a Benford-szabályt. Sőt, a számok közel egyenletes valószínűséggel fordulnak elő, ami igen furcsának nevezhető a kutatók szerint. Amennyiben egy-egy nem várt értéknél lenne csak nagyobb az eltérés, az még annyival esetleg magyarázható lenne, hogy éppen ott tart a számláló. De az oroszok esetében nem ezt látni.
A szerzők végső következtetése szerint a Benford-szabály – a meghatározott érzékenységen belül – érvényesülni látszik a legtöbb vizsgált országnál, de a két említett helyen – az oroszoknál és az irániaknál – a számokat lehet, hogy manipulálták.
Ehhez ugyanakkor hozzá kell tennünk, hogy a Benford-szabály bár elterjedt módszernek számít a hasonló csalások vizsgálatában, mégsem számít tökéletes eszköznek. Nincs ugyanis egy tudományosan elfogadott határérték, amin túl már biztosra lehetne venni a számok kézzel való vezérlését. Továbbá előfordultak más kutatásokban már fals pozitív esetek is, ahol bizonyítottan természetes eredetű adathalmazok sem feleltek meg a Benford-szabálynak.
Teljesen biztosat ezért nem lehet állítani, ahogy nem teszik ezt a hivatkozott tanulmányban sem. De a gyanú azért jócskán ott van. Sajnos Magyarország nem szerepel a vizsgálatukban, így a hazai COVID-számok tesztelését magunk végeztük el. Az eredmények tartogatnak némi izgalmakat, és erről hamarosan egy újabb cikkben számolunk be itt, a Portfolio Prof oldalán.
Megdöbbentő számok a magyar egészségügyből: az orvosok fele nem volt a munkahelyén
Kemény szavakkal üzent a betegeknek Pintér Sándor egy előadásában.
Egyetlen tény mutatja meg igazán, hogy mennyire felpörögtek az oroszok a fronton
Még soha nem volt ennyi.
Felsorakoztak a fenyegetett sziget páncélosai: elsöprő támadásra készülnek
Nagyon is valós a veszély.
Ismeretlen drón bénította meg a forgalmat Európa egyik legfontosabb repterén - Brüsszel vizsgálatot indít
Minden járatot átirányítanak.
Bejelentést tett a Revolut: fordulat jött a kriptopénz-szolgáltatásokban
A magyar ügyfelekre külön információk vonatkoznak.
Itt meg mi történik? Amerika kapujában mozgolódnak az oroszok, ez olaj lehet a tűzre
Rendkívül feszült a helyzet.
"Már anyám is Pythonban kódol" - Az automatizáció, ami nem is létezik
Mindenki programozóvá vált, hiszen a ChatGPt lekódol nekünk mindent – persze, pont úgy, ahogy mindenki tolmáccsá vált a Google Translate-től. Az AI olyan forradalommal kecsegtet,... The pos
VSME keretrendszer: egyszerű ESG és fenntarthatósági jelentés KKV-knak
Bár a fenntarthatósági jelentéstétel egyre inkább az üzleti működés része, a kis- és középvállalkozások számára továbbra is önkéntes marad. A VSME (Voluntary Sustainability Reporting S
Lakásárak: rekordtempó Budapesten, komoly lendület vidéken
A magyar lakáspiac 2025 második felében izgalmas átalakuláson megy keresztül. Az MNB frissen közzétett lakásárindexe és a novemberi kamatstatisztika egyaránt megerősíti: Budapest és a nagyob
Forint a reflektorfényben, régiós devizák a kulisszák mögött
2025-ben a forint a régió sztárja, miközben a cseh korona, a lengyel zloty és a román lej vegyes képet mutat. Mit üzen ez az EUR/HUF pályáról és a hozamgörbékről? The post Forint a reflektor
Az osztalék portfólióm - 2025. október
Ebben a hónapban is bevásároltam rendesen, általában a jelentések után. A cégek nagy részét nem örökre, hanem csak pár hónapra terveztem megvenni, aztán majd eladom, ha felmennek. Ha mégsem
Top10 upgrade
A roic.ai pár hónapja kijött egy API fejlesztéssel (v2), kipróbáltam, mert az AAPL ticker minden adatához hozzá lehet férni az API-n keresztül, hogy tesztelhessük a dolgot, és előfizettem rá.
A tudás gazdasága: Joel Mokyr és a fenntartható növekedés Nobelje
A közgazdsági Nobel-díjban eddig már 99 ember részesült, mégis közülük nagyon kevesen foglalkoztak kifejezetten gazdaságtörténettel. 2025-től már Joel Mokyr is a ritka kivételek közé tart
Kamu MI videók a politika szolgálatában: mit lehet tenni a visszaélések ellen?
A mesterséges intelligencia nyújtotta lehetőségek visszaélésszerű alkalmazására régóta figyelmeztetnek, mostanra azonban saját bőrünkön tapasztalhatjuk ezt. Egymás után, szinte naponta jel
Kisokos a befektetés alapjairól, tippek, trükkök a tőzsdézéshez
Előadásunkat friss tőzsdézőknek ajánljuk, összeszedünk, minden fontos információt arról, hogy hogyan működik a tőzsde, mik a tőzsde alapjai, hogyan válaszd ki a számodra legjobb befektetési formát.
Tőzsde kezdőknek: Hogyan ne égesd el a pénzed egy hét alatt!
A tőzsde világában a lelkesedés könnyen drága hibákhoz vezethet – előadásunk abban segít, hogy kezdőként is megértsd a legfontosabb alapelveket, felismerd a kockázatokat, és elkerüld, hogy egy hét alatt elolvadjon a megtakarításod
Ráugrottak a cégek az alacsony kamatra - Mi történt?
Szabados Richárd, a Nemzetgazdasági Minisztérium államtitkára volt a vendégünk.
Elfeledett adónemre vetett szemet a kormány: újra jön a reklámadó?
Váratlan emelés jöhet.
Jelentősen változhat a kibercsalásokhoz kötődő kártérítési felelősség rendszere
Jön a digitális euró is, nem kevés aggállyal.


