Jak to funguje
Prostřednictvím distribuční funkce snadno zjistíme pravděpodobnost výskytu dat rovných a menších než je hodnota Z.
Což je snadno představitelné, pokud by naše data vypadala stejně jako Z-rozdělení, ale co když naše data vypadají třeba takto?
Na ose x vidíme, že naše data mají aritmetický průměr 98 (a ne 0 jako má Z-rozdělení), směrodatná odchylka je 12 (a ne 1 jako má Z-rozdělení) a hodnoty na ose y jsou četnosti jednotlivých intervalů hodnot ( a ne hustota pravděpodobnosti výskytu jako má Z-rozdělení). Co s tím?
Pokud známe četnost dat, dá se spočítat i relativní četnost,. A jestliže máme dostatečně velký vzorek, tak tato relativní četnost se blíží pravděpodobnosti výskytu dat v populaci.
Tvar rozdělení našich dat se nezmění, průměr a směrodatná odchylka také ne, pouze měřítko na y-ové ose se zmenší. Takže když si představíme naše data v grafu relativní četnosti (místo absolutní četnosti, která je typická pro histogram), už nemáme pocit, že srovnáváme jabka a hrušky.