Normální rozdělení

Normální rozdělení je v TLSS světě poměrně důležitý matematický model. Používáme ho pro odhad pravděpodobnosti výskytu hodnot v populaci na základě dat našeho vzorku.  Dá se jím nahradit (aproximovat), za určitých podmínek, mnoho jiných matematických modelů. Což, pokud můžeme, tak děláme, protože parametry tohoto modelu jsou snadno pochopitelné.

Graficky je vyjádřena hustota pravděpodobnost výskytu všech hodnot jako křivka Gaussovy funkce. Proto se modelu také někdy říká 

  • Gaussovo rozdělení

Rozdělení je souměrné a má tvar klobouku, někdo v něm vidí tvar zvonu.

Data, která mají toto rozdělení, vznikla součtem různých nezávislých malých vlivů. Je pro ně typické, že se snažíme o nějakou konkrétní hodnotu (průměr), ale nikdy to není dokonalé (data se souměrně pohybují vlevo i vpravo od průměru).

  • výtvory přírody
  • náhodné chyby 
  • technické parametry

Pro rozdělení jsou typické dva parametry: 

  • aritmetický průměrµ („mí“), což je nejvyšší bod křivky a zároveň její střed, který určuje polohu na ose x.
  • směrodatná odchylka σ („sigma“) – určuje tvar rozdělení  čím je směrodatná odchylka větší, tím, je křivka širší (pozn. experti na statistiku jsou zvyklí používat jako druhý parametr rozptyl σ2).

Tyto parametry jsou uváděny u typu konkrétního normálního  rozdělení ve formě:

Pravidlo 68,3 - 95,45 - 99,73

Při analýze dat nás velice často zajímá, kolik dat se vejde do jedné, dvou nebo tří směrodatných odchylek.  Pro data, která se dají modelovat normálním rozdělením, tzv. normální data, platí, že téměř všechna (99,73%) se vyskytují v rozmězí tří směrodatných odchylek.

Chceme-li zjišťovat pravděpodobnost výskytu hodnot v populaci bez statistického SW, používáme k tomu konkrétní model normálního rozdělení N(0;1), kterému se říká Z-rozdělení, a hodnoty jeho distribuční funkce najdeme v každých statistických tabulkách.

Malinko vědy:

Jeho hustota pravděpodobnosti je definována Gaussovou křivkou: