Pravděpodobnost vzniku defektů

Jiná než normální data

Jestliže naše data neprošla testem normality a máme podezření, že nemají tendenci soustředit se souměrně kolem své střední hodnoty, model Normální rozdělení, resp. Z-rozdělení (viz pravděpodobnost defektů normálních dat) nebude příliš dobře simulovat výskyt našich dat v populaci (tj. v procesu)

Co tedy v takovém případě dělat?

Standardně se na školeních LSS doporučují dvě možnosti, buď zkusit data transformovat na normální nebo se pokusit najít jiný pravděpodobnostní model, který by lépe simuloval pravděpodobnost výskytu našich dat.

1) Transformace dat na normální rozdělení

Jestliže nejsme nepřátelé logaritmických transformací, můžeme se pokusit náš vzorek dat transformovat na normální data prostřednictvím Box-Coxovy nebo Johnsonovy transfomace. 

Jakmile máme transformovaná data, která prošla testem normality, můžeme u nich zjistit pravděpodobnost podle modelů Normálního rozdělení.

2) Hledání vhodného modelu

Hledat vhodný model se dá pomocí empirické distribuční funkce,  pravděpodobnostního papíru  a testu dobré shody. V současné době se pro hledání vhodného modelu používají statistické SW, my používáme Minitab.

Jakmile najdeme nejvhodnější model s parametry odpovídající našim datům, prostřednictvím Excelu nebo statistického SW zjistíme pravděpodobnost výskytu dat. Dělá se to na stejném principu, jako když používáme model Normálního rozdělení (viz Pravděpodobnost normálního rozdělení). V Excelu místo NORM.DIST vyvoláváme funkce pro jiné modely, např. WEIBULL. DIST, LOGNORM.DIST, EXPON. DIST atd. V Minitabu vybereme místo modelu Normálního rozdělení, to, které potřebujeme.

Jestliže máme dva specifikační limity, sčítáme obě pravděpodobnosti defektů.

Jak pro logaritmické transformace, tak pro identifikaci vhodného modelu, potřebujeme statistický SW (běžně dostupný Excel to neumí a dělat takové výpočty ručně je nereálné). Co tedy dělat, pokud ho nemáme?

3) Převod spojitých dat na počty

Když máme dostatečně velký vzorek, můžeme na základě relativní četnosti defektů odhadnout pravděpodobnost vzniku defektu v populaci.  Jinými slovy, jestliže máme dostatečně velký (tj. reprezentativní) vzorek dat, spočítáme v něm počet hodnot, které překročily specifikační limity (= defektní jednotky). Tím získáme ze spojitých dat data typu „počty“ a můžeme pro odhad pravděpodobnosti defektu použít některou z měr defektnosti, nejčastěji DPMO, kterou i snadno převedeme na hodnotu sigma.

Pokud bychom poté chtěli převést DPMO na hodnotu sigma, tak sice zase budeme používat model Normálního rozdělení (nahrazujeme jím  binomické, resp. Poissonovo rozdělení), ale tam už se tváříme, že předpokládáme, že defekt má stejnou pravděpodobnost vzniku (což např. ve službách často neplatí). Ono nám totiž nic moc jiného nezbývá.