F-test pro dva rozptyly

Tento parametrický test patří mezi F-testy, které potřebujeme při testování hypotéz. Používá se pro zkoumání variability dat (rozptyl) dvou vzorků, kdy zkoumáme domněnku, jestli se variabilita dat liší, např. při měření různými operátory, případně přístroji. Aby dobře fungoval, je třeba, aby měly oba vzorky normální rozdělení.

Používáme standardní postup, který stojí na principu parametrických testů.

Oboustranný test

Vzorek ukazuje, že se variabilita dat vzorků liší. Můžeme učinit stejný závěr pro populaci?

Nulová hypotéza říká, že rozptyl populací, ze kterých vzorky pochází, je stejný.

Alternativní hypotéza tvrdí, že se liší.

Testovací statistika se počítá podle následujícího vzorce:

Který vzorek bude první a který druhý volíme tak, aby hodnota testovací statistiky vyšla větší než jedna.

Jestliže mají obě populace normální rozdělení a rozptyl jejich dat se neliší, potom má nulové rozdělení testovací statistiky podobu F-rozdělení s parametry v = n1-1, w = n2 -1.

Velikost pravděpodobnosti výskytu hodnot stejných nebo ještě vyšších než testovací statistika se nazývá p-hodnota. 

Jedná se o oboustranný test, tj, pokud tedy chceme nastavit riziko alfa = 5% (odpovídající hodnotě pravděpodobnosti výskytu dat 0,05), rozdělujeme tuto hodnotu napůl a v F rozdělení (s parametry v a w hledáme), od jaké hodnoty (kritická hodnota) mají data pouze pravděpodobnost výskytu o velikosti 0,025.

Kritickou hodnotu (odpovídající nastavenému riziku alfa) můžeme najít pracně ručně v tabulkách nebo pomocí Excelu (funkce FINV (pravděpopodobnost;v;w)) , Black Belti k tomu často používají Minitab.

Jakmile vyjde hodnota testovací statistiky vyšší než kritická hodnota (jestliže porovnáváme hodnoty)nebo p-hodnota nižší než polovina rizika alfa (jestliže porovnáváme pravděpodobnosti), můžeme nulovou hypotézu zamítnout.

Jednostranný test

Pokud bychom potřebovali  (nestandardně pro testování) „přijmout“ nulovou hypotézu, tj. že je možné, že se rozptyly neliší, protože nelze vyvrátit nuvlovou hypotézu (což právě potřebujeme pro měření dat), nastavili bychom alternativní hypotézu takto:

Kritickou hodnotu v takovém případě hledáme přímo pro velikost rizika alfa. Pokud bychom např. riziko alfa nastavili na 0,05, potom hledáme v F rozdělení (s parametry v a w) od jaké hodnoty mají data pravděpodobnost výskytu pouze 5%.