Centrální limitní věta
Centrální limitní věta je pro nás při práci s daty velmi důležitá. Zjednodušeně řečeno říká, že “ Rozdělení průměrů vzorků (náhodně vybraných dat z populace) se tím více blíží normálnímu rozdělení, čím větší vzorky jsou„.
V matematickém světě je toto tvrzení vyjádřeno vícero způsoby (matematické věty), my je však znát nepotřebujeme.
Také se můžeme setkat s názvem:
Centrální limitní teorém
Centrální limitní větu využíváme (aniž bychom to většinou věděli) při testování hypotéz a intervalech spolehlivosti. Někteří „odborníci“ pomocí ní transformují původní řadu nenormálních dat na data průměrů vzorků, která jsou „normální„.
Jak to funguje, je vysvětleno u střední chyby průměru (SEM).
Pozor u kontrolních grafů
I přestože na některých školeních LSS (Black Belt) doporučují lektoři takto „upravit“ data na „normální“, toto zprůměrování dat není vhodné pro sestavování limitů kontrolních grafů při zkoumání, jestli je proces stabilní. Riskujeme totiž, že bychom kvůli možným odlehlým hodnotám měli příliš široké kontrolní limity.
Odlehlé hodnoty, způsobené zvláštními příčinami, ovlivňují průměr. My bohužel při sestavování kontrolních limitů z prvních krátkodobých dat neumíme často rozlišit, která data jsou v rámci běžné variability a která jsou již ovlivněná nějakou zvláštní příčinou. Sestavení širokých limitů může způsobit, že špatně oddělíme běžnou variabilitu od zvláštní. Což vede k riziku, že nestabilní proces budeme považovat za stabilní.