Valor medio di una variabile casuale

Attività successiva Attività precedente Home

Valor medio di una variabile casuale

Per introdurre il concetto di valor medio di una variabile casuale conviene partire dal valor medio di un insieme finito di dati numerici (media aritmetica). Lanciamo ad esempio 100 volte un dado e calcoliamo il valor medio dei valori. Ecco il codice di Derive

La sommatoria che compare alla riga #6 significa semplicemente: somma tutti i valori x con x che varia nel vettore v. Possiamo però calcolare il valor medio anche in un altro modo: moltiplicheremo ogni valore i, i=1, 2, ..., 6, per la sua frequenza f(i), sommeremo tali prodotti e divideremo il risultato per n. Ecco il codice

Il secondo modo di calcolo ci fa capire che il valor medio è dato dalla somma dei valori possibili, ciascuno moltiplicato per la sua frequenza relativa (che può essere anche zero); si ha infatti

Ora ragioniamo sulla variabile casuale

X = valore che si presenta lanciando un dado

Tenendo conto dell'interpretazione frequentistica della probabilità siamo spinti a definire il valor medio della variabile casuale X, che indicheremo con E(X), così

dove p(i) indica la probabilità del valore i; quindi

Come vedi il valor medio teorico si discosta di poco da quello empirico della nostra simulazione. Puoi facilmente verificare che all'aumentare del valore di n (riga #2), il valor medio dei dati tende ad avvicinarsi al valor medio della variabile casuale X (perché le frequenze relative tendono alle probabilità).

Vediamo ora un esempio in cui si utilizza il concetto di valor medio di una variabile casuale.

Problema Quante volte devo lanciare, in media, una moneta affinché si presentino entrambe le facce?

Qui la variabile casuale che entra in gioco è

X = numero di lanci per avere sia testa sia croce

Quali sono i valori possibili di X? X non può essere evidentemente uguale a 1 (con un solo tiro non posso ottenere entrambe le facce), ma può assumere i valori 2, 3, 4, ... Può assumere qualsiasi valore intero maggiore di 1. Naturalmente è molto improbabile che sia, ad esempio, X=1000; ciò vorrebbe dire che per 999 volte è sempre uscita "testa" oppure sempre "croce". Tuttavia dobbiamo contemplare, in linea di principio, anche casi via via più improbabili. X è dunque una variabile casuale discreta a infiniti valori. Tenendo presente il diagramma qui a fianco, in cui si è assunto che al primo tiro si presenti "testa" (ma sarebbe la stessa cosa se si presentasse "croce"), è facile rendersi conto che la probabilità che sia X=i (con i>1) è

(come vedi la probabilità tende rapidamente a zero al crescere di i). Ne segue che il valor medio di X è

Calcoliamo la somma della serie con Derive

In conclusione: dobbiamo lanciare mediamente 3 volte una moneta affinché si presentino entrambe le facce.

Vogliamo verificare sperimentalmente questo risultato teorico mediante una simulazione con Derive. Dovremo generare delle sequenze casuali di lanci di una moneta; ogni sequenza terminerà nel momento in cui si presentano entrambe le facce. Le nostre sequenze saranno rappresentate mediante vettori; ad esempio due sequenze potrebbero essere [T, T, C] oppure [C, C, C, C, T]. Ecco il codice per generare una sequenza casuale

Ed ecco come lo digiterai (facendo attenzione a virgole e parentesi)

Le variabili sequenza, esiti, indicatore ed i sono dichiarate nell'intestazione del comando seq() in modo che Derive le consideri variabili locali ma non sono argomenti che dovremo passare al nostro comando quando lo utilizzeremo (si tratta infatti di variabili che vengono definite all'interno del programma). La variabile sequenza è all'inizio un vettore vuoto al quale via via aggiungeremo gli esiti casuali "T" (esiti SUB 1) oppure "C" (esiti SUB 2). Alla variabile i viene infatti assegnato un valore casuale uguale a 1 o 2. La variabile indicatore è posta all'inizio uguale al vettore [0, 0] e ad ogni "lancio" viene aggiornata ponendo la prima componente uguale a 1 se i=1 e la seconda componente uguale a 1 se i=2. Si esce dal ciclo (loop) non appena l'indicatore sia [1, 1]. Proviamo il nostro comando

Abbiamo ottenuto i vettori delle righe #3-#8 semplificando più volte il comando seq() alla riga #2. Nota che alla riga #4 abbiamo ottenuto una sequenza che avremmo giudicato "rara": 7 croci prima di ottenere testa. Proviamo a vedere se, simulando 1000 sequenze, ne otteniamo di lunghezza maggiore o uguale a 10

Bene, torniamo al nostro scopo. Alla riga #9 abbiamo generato un vettore di 1000 sequenze. Calcoliamo il valor medio della loro lunghezza

Come vedi il valor medio empirico è molto vicino a 3 cioè al valor medio della variabile casuale X.

Bibliografia

Michele Impedovo - Un problema di dadi (Un problema di dadi.pdf)

Attività successiva Attività precedente Home

Ultimo aggiornamento agosto 2007
Versione di Derive utilizzata 6.10
p.lazzarini@tin.it