Kvantil

V tomto článku se dozvíte, co to jsou kvantily, jaké problémy při jejich definování a zápisu nastávají, jaké nejčastější kvantily používáme i jaké je jejich využití v praxi. Čtěte dále.

Kvantily (z latinského „quantilis“, tj.: „Jak malý/velký?“) jsou ve statistice hodnoty (čísla), která dělí soubor seřazených hodnot (například naměřených životností žárovek v hodinách) na několik přibližně stejně velkých částí.

Kvantil je tedy míra polohy rozdělení pravděpodobnosti náhodné veličiny, kde jednotlivé kvantily popisují body, ve kterých distribuční funkce náhodné proměnné prochází danou hodnotou.

Kdy se používají kvantily?

Kvantilové charakteristiky znaku využíváme, jakmile máme důvod místo aritmetického průměru za charakteristiku polohy volit raději medián. V tom případě se směrodatná odchylka nahrazuje tzv. mezikvantilovou odchylkou.

Kvantily použijeme i tehdy, jestliže chceme soubor rozdělit na několik částí, které mají přibližně stejný počet prvků. Existuje mnoho kvantilů, kdy ty nejznámější jsou medián, který dělí soubor na dvě stejně početné poloviny, kvartily, ty dělí soubor na čtyři čtvrtiny, anebo percentil, který dělí soubor na 100 intervalů (tj. něco jako procenta).

Definice kvantilu

Kvantily tvoří ve skrze inverzní funkci k funkci distribuční. Lze uvést, že v případě spojitého rozdělení s distribuční funkcí F(x) je kvantil Qp takové číslo, pro které platí
P(X ≤ Qp) = p, tedy F(Qp) = p.

Pokud je ale distribuční funkce rostoucí (tedy zároveň prostá), lze kvantil zapsat přímo jako inverzní funkci:
Qp = F−1(p).

Distribuční funkce ovšem nemusí být prostá (nehledě na to, že je vždy neklesající), takže tuto definici nelze použít vždy! U diskrétních rozdělení pak ani nemusí ve všech případech existovat přesný bod, kde by distribuční funkce dosahovala zcela přesně požadované hodnoty. Proto se kvantil Qp obecněji definuje jako takové číslo, pro které platí, že
P(X ≤ Qp) ≥ p a zároveň P(X < Qp) ≤ p.

Distribuční funkcí to můžeme vyjádřit jako
F(Qp+) = F(Qp) ≥ p a zároveň F(Qp−) ≤ p.

Ani tato obecná definice stále přesně neurčí kvantil v případě, že distribuční funkce nebude prostá. V takovém případě může jedné hodnotě p odpovídat rovnou vícero čísel Qp, které tuto definici splňují. To se obvykle nepovažuje za problém. Někdy se ale k definici doplní způsob výběru jednoznačné hodnoty, např. největší (popřípadě nejmenší) z těchto čísel, jejich průměr apod.

Jedná se ale jen o konvence bez nějakého hlubšího matematického významu.

Speciální označení kvantilů

Kvantily pro některé významné hodnoty označujeme zvláštními jmény a pro nejdůležitější rozdělení jsou hodnoty základních kvantilů uváděny i v tabulkách.

Jsou to zejména tyto:
1. Medián
Medián je kvantil rozdělující statistický soubor na dvě stejně početné množiny, tzn., že se jedná o kvantil {Q_{0,5}}Q_{{0,5}}.

2. Tercil
Tercily rozdělují statistický soubor na třetiny. Pokud máme dva tercily, pak 1/3 prvků má hodnoty menší nebo rovné hodnotě prvního tercilu a 2/3 prvků mají hodnoty menší nebo rovné hodnotě tercilu druhého.

3. Kvartil
Tři kvartily rozdělují statistický soubor na čtvrtiny, kde 25 % prvků má hodnoty menší než dolní kvartil {Q_{0,25}}Q_{{0,25}} a 75 % prvků jsou hodnoty menší než horní kvartil {Q_{0,75}}Q_{{0,75}}.
Kvartily se někdy označují {Q_{1}}Q_{1} a {Q_{3}}Q_{3}.

4. Kvintil
Čtyři kvintily dělí statistický soubor na pět stejných dílů, přičemž 20 % prvků souboru má hodnoty menší nebo rovné hodnotě prvního kvintilu a 80 % prvků má hodnoty větší (nebo rovné).

5. Decil
Decil dělí statistický soubor na desetiny, tj. 10 částí. Jako {k} („k-tý“) decil označujeme {Q_{k/10}}Q_{{k/10}}.

6. Percentil
Percentil dělí statistický soubor na setiny (obdobně jako procenta „%“), kdy jako {k} („k-tý“) percentil označujeme {Q_{k/100}}Q_{{k/100}}.

Charakteristiky variability kvantilů

Hodnoty kvantilů představují charakteristiky polohy, ale znalosti kvantilů lze použít i k určení charakteristiky variability.
· Mezikvartilové rozpětí

Pomocí horního a dolního kvartilu můžeme zavést mezikvartilové rozpětí, které definujeme jako hodnotu {Q_{0,75}-Q_{0,25}}Q_{{0,75}}-Q_{{0,25}}.
· Mezidecilové rozpětí

Pomocí decilů lze zavést mezidecilové rozpětí, které definujeme jako {Q_{0,9}-Q_{0,1}}Q_{{0,9}}-Q_{{0,1}}.
· Mezipercentilové rozpětí

Pomocí percentilů lze zavést mezipercentilové rozpětí, které definujeme jako {Q_{0,99}-Q_{0,01}}Q_{{0,99}}-Q_{{0,01}}.

Použití kvantilů

Kvantily lze využít např. pro vyhodnocení přijímacích testů. Bodové výsledky všech zájemců tvoří statistický soubor, zatímco příslušné kvantily označují, jaká část zájemců dosáhla daného výsledku a jaká část dosáhla výsledku lepšího.

Jak si to vyložit v praxi? Jestliže například kvantil 90 % má hodnotu 130 bodů a některý student v testu získal právě 130 bodů, tak ví, že má lepší hodnocení než 90 % všech studentů. To znamená, že je mezi 10 % nejlepšími a pokud má být přijato např. 15 % zájemců, měl by se kvalifikovat bez problémů.

Příklady kvantilů
U standardního normálního rozdělení s nulovou střední hodnotou a jednotkovou směrodatnou odchylkou nabývají vybrané kvantily těchto hodnot:
sp 0,5 0,9 0,95 0,975 0,99 0,995
Qp 0,0 1,2816 1,6449 1,9600 2,3263 2,5758

Na tomto příkladu vidíme například to, že necelý trojnásobek směrodatné odchylky u tohoto rozdělení pokrývá 99 % hodnot.