Jak zjistit hodnotu odpovídající percentilu vzorku v Minitabu

Percentil empirických hodnot (vzorku dat) zjistíme pomocí Kalkulátoru (data nemusíme vzestupně seřazovat):

  1. Na horní liště vybereme Calc-Calculator
  2. Do políčka „Store result in variable“ zadáme název sloupce, do kterého chceme spočítanou hodnotu percentilu uložit
  3. V okně pod „Functions“ vybereme PERCENTILE
  4. Klikneme na SELECT
  5. Tím se v okně „Expression“ objeví PERCENTILE (number;probability)
  6. V závorce nahradíme „number“ názvem sloupce, ve kterém máme data našeho vzorku
  7.  A „probability“ nahradíme percentilem, který potřebujeme vypočítat (např. medián je 0,5)
  8. Po kliknutí na OK se nám v požadovaném sloupci objeví hodnota percentilu, který jsme chtěli vypočítat

Pozn.: Vzorec, který používá Minitab pro výpočet percentilů v kalkulátoru, je stejný jako vzorec, který používá pro výpočet percentilů pro krabicový graf.

Princip si ukážeme na malém vzorku dat. Aby však měly hodnoty percentilů smysl, potřebujeme mít vzorek o velikosti minimálně 100 hodnot,  v opačném případě musíme hodnoty percentilů interpolovat, čímž vznikají nepřesnosti.

Máme vzorek 30 dat:

Ve vzorku našich dat chceme zjistit, jaké hodnotě (pozor: tato hodnota nemusí být v datech) odpovídá např. 80%  vzestupně seřazených dat, tj. zjišťujeme 80. percentil.

Do Minitabu budeme 80% zadávat ve formě percentilu, tj. 0,8.

Minitab spočítal, že 80. percentilu odpovídá hodnota 24,34.

Jak zjistit percentil pro konkrétní hodnotu v Minitabu

Percentily pro konkrétní hodnotu ve vzorku zjístíme např. pomocí Empirické distribuční funkce  (data nemusíme vzestupně seřazovat).

  1. Na horní liště pod GRAPH vybereme Empirical CDF
  2. Zvolíme Single (máme jeden vzorek dat)
  3. Do pole Graph variables napíšeme název sloupce, ve kterém máme data
  4. Klikneme na Distribution, objeví se záložka Distribution, na které nic nevyplňujeme (týká se modelu)
  5. Přepneme na  záložku Data Display
  6. Zaškrtneme Connect line only (tím se nám nebude zobrazovat distribuční funkce žádného modelu, která by nás pouze pletla)
  7. Potvrdíme OK
  8. Tím nás to vrátí do Okna Empirical CDF Single, kde opět klikneme na OK
  9. Najedeme-li myší na křivku nad naší hodnotou dat na ose x, objeví se rámeček s odpovídající hodnotou na ose y, která odpovídá percentilu.

Princip si ukážeme na malém vzorku dat. Aby však měly hodnoty percentilů smysl, potřebujeme mít vzorek o velikosti minimálně 100 hodnot,  v opačném případě musíme hodnoty percentilů interpolovat, čímž vznikají nepřesnosti.

Použijeme stejný vzorek dat.

 Chceme z našeho vzorku třeba zjistit, na jakém percentilu leží hodnota 16,9  (tuto hodnotu vzorek obsahuje), tj. kolik procent dat je menších nebo stejných než tato hodnota.

Z empirické distribuční funkce jsme odečetli, že hodnota 16,9 leží na cca 47. percentilu, takže cca 47% dat je ve vzorku stejných nebo menších než je hodnota 16,9. 

Pozn.: Tento výstup (viz obrázek) má na ose y rovnou procenta (relativní četnost vynásobená 100). Standardně bývají hodnoty na ose y ve formě relativní četnosti.