Jak to funguje

Prostřednictvím distribuční funkce snadno zjistíme pravděpodobnost výskytu dat rovných a menších než je hodnota Z.

Což je snadno představitelné, pokud by naše data vypadala stejně jako Z-rozdělení, ale co když naše data vypadají třeba takto?

Na ose x vidíme, že naše data mají aritmetický průměr 98 (a ne 0 jako má Z-rozdělení), směrodatná odchylka je 12 (a ne 1 jako má Z-rozdělení) a hodnoty na ose y jsou četnosti jednotlivých intervalů hodnot ( a ne hustota pravděpodobnosti výskytu jako má Z-rozdělení). Co s tím?

Pokud známe četnost dat, dá se spočítat i relativní četnost,. A jestliže máme dostatečně velký vzorek, tak tato relativní četnost se blíží pravděpodobnosti výskytu dat v populaci.

Tvar rozdělení našich dat se nezmění, průměr a směrodatná odchylka také ne, pouze měřítko na y-ové ose se zmenší. Takže když si představíme naše data v grafu relativní četnosti (místo absolutní četnosti, která je typická pro histogram), už nemáme pocit, že srovnáváme jabka a hrušky.

Teď ještě potřebujeme vyřešit měřítko (jako když na mapě změříme délku trasy cca 1 cm a pomocí měřítka mapy odhadneme, kolik km budeme muset reálně našlapat). Potřebujeme dostat náš průměr na nulu a směrodatnou odchylku na jedničku. Jakou hodnotu by měla naše hodnota X v Z rozdělení?