Kvantily jsou charakteristiky polohy statistického znaku podobně jako např. aritmetický průměr a medián. Kvantily lze určit pro ordinální, intervalové a poměrové typy dat.
Soubor n hodnot uspořádáme podle velikosti: x_1 \le x_2 \le \ldots \le x_{n-1} \le x_n
Mějme číslo \theta mezi nulou a jedničkou. Kvantil Q_{\theta} je hodnota, která dělí uspořádanou posloupnost hodnot v souboru na dolní a horní část tak, že dolní část obsahuje alespoň \theta \cdot n hodnot a horní část alespoň (1-\theta)\cdot n hodnot.
x_1 \le \ldots \le x_c \le Q_{\theta} \le x_{c+1} \le \ldots \le x_n
- Je-li \theta \cdot n necelé číslo, a nejbližší větší celé číslo je k, volíme obvykle Q_{\theta}=x_k.
- Je-li \theta \cdot n=m celé číslo, volíme Q_{\theta} = \frac{x_{m}+x_{m+1}}{2} (pokud je možné tento aritmetický průměr spočítat - tedy pro intervalové a poměrové znaky).
Například vezmeme soubor osmi čísel 0,0,0,0,1,2,3,4. Kvantil Q_{0{,}1} určíme takto: 0{,}1 \cdot 8 = 0{,}8, nejbližší větší celé číslo je 1, takže Q_{0{,}1}=x_1=0. Kvantil Q_{0{,}75} určíme takto: 0{,}75 \cdot 8 = 6, takže Q_{0{,}75}=\frac{x_6+x_7}{2}=\frac{2+3}{2}=2{,}5.
Pro ordinální znaky nemusí být možné spočítat aritmetický průměr. Jako kvantil Q_{\theta} pak zvolíme některou hodnotu, která vhodně dělí uspořádanou posloupnost hodnot souboru.
Například spočítejme kvantil Q_{0{,}8} pro hodnoty S, S, M, L, XXL znaku „velikost oblečení“. 5 \cdot 0{,}8=4, Q_{0{,}8} je jakákoliv hodnota mezi x_4 a x_5, tedy L,XL, nebo XXL.
p% kvantil Q_{\frac{p}{100}} se nazývá p. percentil.
Některé významné kvantily:
kvantil | název | |
---|---|---|
Q_{0{,}5} | medián | |
Q_{0{,}25} | dolní kvartil | |
Q_{0{,}75} | horní kvartil | |
Q_{0{,}01},Q_{0{,}02},\ldots, Q_{0{,}99} | 1. percentil, 2. percentil, … , 99.percentil |
Mezikvartilové rozpětí je rozdíl horního a dolního kvartilu: Q_{0{,}75}-Q_{0{,}25} Mezikvartilové rozpětí (někdy označované jako IQR) lze spočítat pro intervalové a poměrové znaky.
Například, určeme mezikvartilové rozpětí pro soubor hodnot 0,0,0,0,1,2,3,4. Horní kvartil Q_{0{,}75} jsme už dříve spočítali, je to 2{,}5. Dolní kvartil Q_{0{,}25} je \frac{x_2+x_3}{2}=\frac{0+0}{2}=0. Mezikvartilové rozpětí je 2{,}5-0=2{,}5.