Histogram vs matematický model

Histogram není matemamatický model

Histogram je graf četnosti, který jsme sestavili z reálných naměřených dat, a má konkrétní nejnižší MIN a nejvyšší MAX hodnotu (vidíme je na ose x na obrázku vlevo).

Matematický model je pravděpodobnost (diskrétní data) nebo hustota rozdělení pravděpodobnosti  (spojitá data) výskytu náhodného jevu. Jeho hodnoty (na ose x) můžou být v případě některých modelů i od mínus nekonečna po plus nekonečno.

Na obrázku vidíme jeden z mnoha matematických modelů, který se  používá nejčastěji, protože může za určitých podmínek nahradit modely ostatní. Je to model normálního rozdělení a simuluje pravděpodobnostní výskyt spojitých dat. Tento model je zrovna definován pro hodnoty od nekonečna po nekonečno.

Jako matematický model slouží celý klobouk (obrázek vlevo), většinou se však pro názornost používá pouze jeho obalová křivka (obrázek pravo).

K čemu nám tedy jsou matematické modely? A jak souvisí s histogramem?

Když se podíváme na naše data v histogramu a místo absolutní četnosti si  představíme relativní četnost (změní se pouze měřítko na ose y), lépe se nám to pochopí.

Ona totiž relativní četnost souvisí i pravděpodobností výskytu (když je některých dat čtvrtina z celku, tj. 0,25 neboli 25%, tak je také 25% šance, že se vyskytnou).  Jestliže máme dostatečně velký vzorek homogenních dat, tak pravděpodobnost výskytu dat je velmi podobná relativní četnosti dat. Čím větší vzorek máme, tím je tato podobnost větší.

A my pouze využíváme toho, že tvar polygonu konkrétního histogramu dostatečně velkého vzorku dat je podobný jako tvar křivky konkrétního matematického modelu.

Čím víc se tvar klobouku histogramu blíží křivce matematického modelu, tím lépe nám model modeluje pravděpodobnost výskytu našich hodnot.