domenica 5 luglio 2009

Metodi non parametrici per lo studio della correlazione: test di Spearman e di Kendall

Abbiamo visto nel post precedente, in che modo studiare la correlazione tra variabili che seguano una distribuzione gaussiana con il metodo di Pearson. Nel caso in cui non sia possibile assumere che i valori seguano distribuzioni gaussiane, sono a disposizione due metodi non parametrici: il test rho di Spearman e il test tau di Kendall.

Si vuole studiare la produttività di diversi tipi di macchinari e la soddisfazione degli operatori nel loro utilizzo (espressi con un numero da 1 a 10). Questi sono i valori:
Produttività: 5, 7, 9, 9, 8, 6, 4, 8, 7, 7
Soddisfazione: 6, 7, 4, 4, 8, 7, 3, 9, 5, 8


Cominciamo ad utilizzare per primo il test Rho di Spearman:

> a = c(5, 7, 9, 9, 8, 6, 4, 8, 7, 7)
> b = c(6, 7, 4, 4, 8, 7, 3, 9, 5, 8)
>
> cor.test(a, b, method="spearman")

Spearman's rank correlation rho

data: a and b
S = 145.9805, p-value = 0.7512
alternative hypothesis: true rho is not equal to 0
sample estimates:
rho
0.1152698


La statistica test ci dà come risultato rho = 0.115, il che indica una bassa correlazione (non parametrica) tra le due serie di valori.
Il p-value > 0.05 ci indica che il test non è statisticamente significativo (ossia il valore di Rho campionario non può essere esteso a tutta la popolazione.

Verifichiamo adesso gli stessi dati con il test Tau di Kendall:

> a = c(5, 7, 9, 9, 8, 6, 4, 8, 7, 7)
> b = c(6, 7, 4, 4, 8, 7, 3, 9, 5, 8)
>
> cor.test(a, b, method="kendall")

Kendall's rank correlation tau

data: a and b
z = 0.5555, p-value = 0.5786
alternative hypothesis: true tau is not equal to 0
sample estimates:
tau
0.146385


Anche con il test di Kendall, la correlazione risulta essere molto bassa (tau = 0.146), e p-value > 0.05.

1 commento:

  1. Ciao, complimenti per il blog! è un salvavita!
    Se dovessi studiare la correlazione tra due serie, di cui una è un vettore di date, come dovrei comportarmi?
    grazie

    RispondiElimina