Számhasonlításilag jelentős

Felfedez-e lényegi különbséget az alábbi állítások között?

  • Brit tudósok kimutatták, hogy az anya dohányzása a terhesség alatt nem hat az újszülött testsúlyára.
  • Brit tudósok egy csoportja nem tudott kimutatni erős kapcsolatot az anya terhesség alatti dohányzása és az újszülött testsúlya között.

Ha nem, az arra világít rá, hogy a statisztikai becslések eredményeinek bemutatása nagy felelősséggel jár. Ha igen, akkor is, bár a kedves Olvasó kellően éber ahhoz, hogy ne lehessen könnyen félrevezetni.

Az Amerikai Statiszkiai Társaság (American Statistical Association, ASA) idén márciusban egy publikációban lépett fel a „statisztikai szignifikancia” kifejezés használata ellen. Első hallásra kicsit bizarrnak tűnhet, hogy egy statisztikai terminus technicus-t pont az ASA próbál marginalizálni, azonban alapos okuk van rá. És különben is, mi az, hogy „statisztikailag szignifikáns”?

Hogy megértsük a fogalmat és az ASA álláspontját, egészítsük ki a korábbi két állítást egy harmadikkal, és állítsuk őket fordított sorrendbe:

  • Brit tudósok kutatási eredményei szerint napi egy szál, az anya által a terhesség alatt elszívott cigaretta 14,9 grammal[1] csökkenti az újszülött várható testsúlyát, azonban a becslés nagy hibája miatt nem zárható ki kellő bizonyossággal az sem, hogy valójában nincsen összefüggés a kismama dohányzása és az újszülött testsúlya között.
  • Brit tudósok egy csoportja nem tudott kimutatni erős kapcsolatot az anya terhesség alatti dohányzása és az újszülött testsúlya között.
  • Brit tudósok kimutatták, hogy az anya dohányzása a terhesség alatt nem hat az újszülött testsúlyára.

Az első állítás, bár fiktív, egy tipikus statisztikai becslési eredményt ír le. A nyelvezet pontos, magát az eredményt részletgazdagon adja vissza, és emiatt alapvetően az olvasóra bízza, mekkora jelentőséget tulajdonít az eredmények. Az üzenet két részből áll: egyrészt a becsült hatás nagyságát közli, másrészt pedig arra hívja fel a figyelmet, hogy a becslési hiba relatíve nagy, és ezért az eredmény hibahatáron belül tartalmazza a nullát, vagyis „statisztikailag nem szignifikináns”.

A második állítás első ránézésre emészthetőbb formában és kvalitatíve közli ugyanazt. Valójában csak a statisztikai inszignifikanciára fókuszál, és fontos tényeket hallgat el. Az például, hogy napi egy szál cigaretta átlagosan közel 15 grammal csökkenti a gyermek születési súlyát, nem elhanyagolható eredmény. Még akkor sem, ha nagy a becslés hibája. Ez napi egy csomag mellett 300 grammot jelent[2], ami egy potenciálisan 3 kilogrammos újszülött esetében 10 százalékos súlyvesztés[3].

Innen már csak egy lépés a harmadik megfogalmazás, amelyik egyenesen azt állítja, hogy nincsen ok-okozati kapcsolat a terhesség alatti dohányzás és a születési testsúly között. Ezzel egészen távol kerültünk az eredeti üzenettől.

Az ASA szerint pontosan ez az egyik tipikus káros mellékhatása a “statisztikai szignifikancia” túlhangsúlyozásának: van egy SZIGNIFIKÁNS becslési eredményünk, aminek azonban akkora a hibája, hogy STATISZTIKAILAG INSZIGNIFIKÁNSNAK számít. Ezt csak egy lépés úgy értelmezni, hogy ami kijött, az gyakorlatilag elhanyagolható, hogy aztán a következő interpretáció már az legyen: nincs is semmilyen hatás. Jellemzően ezen koreográfia mentén jutnak el hasonló kutatási eredmények a köztudatba, ugyanis minél szélesebb közönség felé kell közvetíteni, annál valószínűbb, hogy a harmadik megfogalmazást fogja választani a hírt közlő médium. Ugyanis az érthető és határozott.

A „statisztikai szignifikancia” tehát egy viszonylag túlértékelt koncepció, ezért vélhetően nehéz lesz száműzni gondolkodásunkból. A kihívást jól érzékelteti, hogy a fogalom angol megfelelőjére („statistical significance”) történő keresés a Google-n közel 50 millió találatot eredményez, az ennek alapjául szolgáló „standard hiba” („standard error”) már csak alig több mint 10 milliót, a statisztikában ugyancsak gyakran használt „azonos eloszlású” („identically distributed”) pedig mindössze kicsivel több mint 1 milliót.

És mit jelent a címben a „számhasonlítás”? Kosztolányi szerint ezzel a kifejezéssel kellene a „statisztika” szót száműznünk a magyar nyelvből.

Vonnák Balázs


Felhasznált irodalom:

Kosztolányi Dezső (1933): „Nyelvművelés. Válasz Schöpflin Aladárnak”, Nyugat, 1933. 9. szám http://epa.oszk.hu/00000/00022/00557/17385.htm

Ronald L. Wasserstein, Allen L. Schirm & Nicole A. Lazar (2019): „Moving to a World Beyond ’p < 0.05’”, The American Statistician, 73:sup1, 1-19, DOI: 10.1080/00031305.2019.1583913


[1] Fiktív szám.

[2] Amennyiben lineáris a hatás.

[3] Fontos ismét hangsúlyozni, hogy az írásban felbukkanó számok a képzelet szülöttei.


Főoldali kép forrása: pixabay.com