In statistica e teoria della probabilità, la funzione di ripartizione (o funzione cumulativa) è una funzione di variabile reale che racchiude le informazioni su un fenomeno (un insieme di dati, un evento casuale) riguardanti la sua presenza o la sua distribuzione prima o dopo un certo punto.
Nel calcolo delle probabilità la funzione di ripartizione, o funzione di probabilità cumulata, di una variabile casuale a valori reali è la funzione che associa a ciascun valore la probabilità del seguente evento: "la variabile casuale assume valori minori o uguali ad ".
Una funzione F è una valida funzione di ripartizione se è non decrescente, continua a destra e
Una funzione di ripartizione non è necessariamente continua a sinistra (e dunque continua globalmente): se è una variabile casuale discreta e un punto del suo supporto, allora è una funzione a gradino e dunque
(ponendo senza restrizioni di generalità ) poiché è una costante indipendente da , mentre
In alcuni modelli è più utile analizzare la probabilità che un certo dato numerico valga più del valore (come nella vita di un organismo, biologico o meccanico): questi casi sono trattati dalla branca chiamata analisi di sopravvivenza. Si definisce allora la funzione di sopravvivenza (dal termine inglesesurvival) come il complemento della funzione di ripartizione:
Nei casi rispettivamente continuo e discreto, valgono naturalmente delle identità speculari a quelle della ripartizione:
e
Ogni funzione di sopravvivenza è una funzione monotona decrescente, vale a dire per
Il tempo rappresenta l'origine, in genere l'inizio di uno studio o l'inizio del funzionamento di alcuni sistemi.
Variabili aleatorie multivariate
Più in generale la funzione di ripartizione di una variabile aleatoria a valori in è la funzione con dominio e codominio l'intervallo definita da
dove sono le componenti di .
Questa funzione possiede la proprietà di essere continua a destra separatamente per ogni variabile. Valgono inoltre le seguenti formule, derivanti dalla definizione:
Per qualsiasi ,
è monotona crescente separatamente in ogni variabile, cioè se ,
se per semplicità,
dove è la funzione di ripartizione della variabile -variata .
Da quest'ultima proprietà viene anche l'uguaglianza
e l'affermazione vale ovviamente anche per ogni permutazione degli indici .
In statistica la funzione di ripartizione empirica, o funzione di distribuzione cumulata, viene usata per descrivere fenomeni quantitativi o comunque descritti con valori misurati su scale ordinali, intervallari o proporzionali, ma non se misurati con una scala nominale.
La funzione di ripartizione viene indicata solitamente con e rappresenta il numero di osservazioni del fenomeno minori o uguali del valore .
Se sono le osservazioni (ordinate in senso crescente), con frequenze relative la funzione di ripartizione ha espressione analitica