Variační rozpětí dat

Seřaďme si data od nejnižší po nejvyšší hodnotu  (odkud pokud se pohybují). Rozdílu mezi nejvyšší a nejnižší hodnotou se říká rozpětí. Je bohužel silně ovlivněno odlehlými hodnotami.

 Rozpětí dat nás zajímá nejen v histogramu, ale i při práci s kvantily, především v krabicovém grafu. Speciálním druhem rozpětí, který potřebujeme pro kontrolní grafy, se říká klouzavé rozpětí.

Mezi rozpětím a směrodatnou odchylkou existuje vztah

Statisticky bylo zjištěno, že šest směrodatných odchylek se vejde do téměř celého rozpětí populace (více než 98% dat populace u všech kopcovitých rozdělení – a taková data měříme na našich procesech).

V případě dat, které mají „normální“ rozdělení, se jedná dokonce o 99,7% dat.

Rozpětí má tendenci růst s počtem dat

Například vzorek o 30 hodnotách má průměrně rozpětí dat dvakrát větší, než vzorek o 4 hodnotách.

Tento růst je velmi dobře vidět na grafu faktoru d2, kterým dělíme rozpětí vzorku tak, abychom z něj mohli odhadnout směrodatnou odchylku populace. 

Do rozpětí celé populace se vejde směrodatnách odchylka populace cca šestkrát. Máme-li  velký vzorek (100 a více dat), směrodatná odchylka populace by se nám do jeho rozpětí vešla průměrně přibližně pětkrát. Do rozpětí vzorku o 10 datech by se nám směrodatná odchylka populace vešla průměrně už pouze třikrát.