Quantile empirico

Un quantile empirico ( -) , chiamato anche semplicemente quantile in breve , è una figura chiave di un campione in statistica . Per ogni numero compreso tra 0 e 1, in termini semplificati, un quantile empirico divide il campione in modo tale che una porzione del campione sia minore del quantile empirico e una porzione del campione sia maggiore del quantile empirico . Ad esempio, se viene fornito un campione di misure di scarpe, il quantile empirico di 0,35 è quella misura di scarpa , in modo che il 35% delle misure di scarpe nel campione siano inferiori e il 65% più grandi di .

Alcuni quantili empirici hanno nomi propri. Includono la mediana ( ), il quartile superiore e il quartile inferiore, nonché i terzili , i quintili , i decili e i percentili .

I quantili (nel senso della teoria della probabilità ) devono essere distinti dai quantili empirici discussi qui . Questi sono indicatori di una distribuzione di probabilità e quindi una funzione astratta (quantità) (simile al valore atteso ), mentre i quantili empirici sono indicatori di un campione (simile alla media aritmetica ).

definizione

Denota la funzione di arrotondamento . Arrotonda ogni numero per difetto al numero intero più piccolo più vicino. Quindi, ad esempio, e .

Dato un campione di dimensione , i cui elementi sono ordinati in base alla dimensione. Ciò significa che si applica

.

Quindi significa per un numero

il quantile empirico di .

Ci sono alcune definizioni che differiscono dalla definizione data qui.

esempio

Il seguente campione è costituito da dieci numeri interi casuali (estratti dai numeri compresi tra zero e cento, forniti con la distribuzione discreta uniforme ):

L'ordinamento fornisce il campione

.

Lo è .

Per uno riceve . Poiché questo è un numero intero, si ottiene la definizione

Per uno riceve . La funzione di arrotondamento fornisce quindi e così

.

Analogamente si ottiene per diretto e quindi , quindi è

.

In contrasto con la media aritmetica, il quantile empirico è robusto contro i valori anomali. Ciò significa che se sostituisci i valori di un campione sopra (o sotto) un certo quantile con un valore sopra (o sotto) il quantile, il quantile stesso non cambia. Ciò si basa sul fatto che i quantili sono determinati solo dal loro ordine e quindi dalla loro posizione l'uno rispetto all'altro e non dai valori numerici specifici del campione. Nel caso del campione sopra, questa sarebbe la media aritmetica . Se ora modifichi il valore più grande del campione, ad esempio, set

,

così è , mentre la mediana e il quartile inferiore e superiore rimangono invariati perché l'ordine del campione non è cambiato.

Quantili speciali

Per alcuni valori, i quantili corrispondenti hanno nomi propri. Vengono brevemente presentati qui di seguito. Va notato che i quantili corrispondenti delle distribuzioni di probabilità sono talvolta indicati con gli stessi nomi propri.

Mediano

La mediana è il quantile e quindi divide il campione in due metà: una metà è più piccola della mediana, l'altra metà è più grande della mediana. Insieme alla modalità e alla media aritmetica, è un importante parametro di localizzazione nelle statistiche descrittive.

Tercile

I due quantitativi per e sono indicati come terzi . Si divide il campione in tre parti uguali: una parte è più piccola del terzo inferiore (= -quantile), una parte è più grande del terzo superiore (= -quantile) e una parte si trova tra i terzi.

Quartile

I due quantili con e sono indicati come quartili . Il -quantile è chiamato quartile inferiore e il -quantile è chiamato quartile superiore. La metà del campione si trova tra il quartile superiore e inferiore, un quarto del campione si trova al di sotto del quartile inferiore e al di sopra del quartile superiore. Il range interquartile , misura della dispersione, è definito sulla base dei quartili .

Quintile

I quattro quantili sono indicati come quintili . Di conseguenza, il 20% del campione è al di sotto del primo quintile e l'80% al di sopra, il 40% del campione è al di sotto del secondo quintile e il 60% al di sopra, ecc.

Decile

I quantili per multipli di , cioè per, sono chiamati decili. Il -quantile è chiamato il primo decile, il -quantile è il secondo decile, ecc. Sotto il primo decile c'è il 10% del campione, sopra il corrispondente 90% del campione. Allo stesso modo, il 40% del campione è al di sotto del quarto decile e il 60% al di sopra.

Percentile

I percentili sono i quantili da a in incrementi di .

Termini derivati

Alcune misure di dispersione possono essere derivate dai quantili . Il più importante è l' intervallo interquartile ( intervallo interquartile inglese )

.

Indica quanto sono distanti i quartili superiore e inferiore, e quindi anche quanto è ampio l'intervallo in cui giace il 50% medio del campione. La distanza (inter) quantile può essere definita un po 'più in generale che per . Indica quanto è ampia l'area in cui giacciono quelle centrali del campione. Perché corrisponde all'intervallo interquartile.

Un'altra misura derivata dello spread è la deviazione assoluta media dalla mediana .

presentazione

Box plot di un campione

Un modo per rappresentare i quantili è il box plot . L'intero campione è rappresentato da una scatola con due antenne. I confini esterni della scatola sono rispettivamente i quartili superiore e inferiore. Ciò significa che metà del campione è nella scatola. La scatola stessa viene nuovamente suddivisa, la linea di demarcazione è la mediana del campione. Le antenne non sono definite in modo uniforme. Una possibilità è scegliere il primo e il nono decile per limitare le antenne.

Prove individuali

  1. Norbert Henze: Stocastico per principianti . Un'introduzione all'affascinante mondo del caso. 10a edizione. Springer Spectrum, Wiesbaden 2013, ISBN 978-3-658-03076-6 , p. 30 , doi : 10.1007 / 978-3-658-03077-3 .
  2. Eric W. Weisstein : Quantile . In: MathWorld (inglese).
  3. Eric W. Weisstein : Interquartile Range . In: MathWorld (inglese).