domenica 5 luglio 2009

Tabella di contingenza per lo studio della correlazione tra variabili qualitative

Qualora si disponga di variabili qualitative, è possibile verificare la correlazione studiando una tabella di contingenza R x C.

Un casinò vuole studiare la correlazione tra la modalità di gioco e il numero di vincitori per classi di età, per verificare se il numero di vincitori dipende dal tipo di gioco che si è scelto di fare, in base all'esperienza. Si dispone dei seguenti dati:
Classi di età: 20-30, 31-40, 41-50
Roulette: 44, 56, 55
Black-jack: 66, 88, 23
Poker: 15, 29, 45


In R dobbiamo anzitutto costruire una matrice con i dati raccolti:

tabella = matrix(c(44,56,55, 66,88,23, 15,29,45), nrow=3, byrow=TRUE)

La sintassi corretta della funzione matrix prevede di esprimere il numero di righe (nrow=3), e di specificare in che ordine sono stati inseriti i dati (in questo caso sono stati ordinati per riga, quindi byrow=TRUE).
Calcoliamo ora il chi-quadro:

> chisq.test(tabella)

Pearson's Chi-squared test

data: tabella
X-squared = 46.0767, df = 4, p-value = 2.374e-09


Il valore X-squared è di molto superiore al valore del chi-quadro-tabulato:

> qchisq(0.950, 4)
[1] 9.487729


Pertanto rifiuto l'ipotesi nulla: esiste correlazione tra i valori analizzati (del resto p-value < 0.05: ci porta a rifiutare l'ipotesi H0, quindi la statistica test è significativa).

Nessun commento:

Posta un commento