sabato 15 novembre 2008

Test t di verifica della media di due campioni appaiati

Confronto delle medie di due gruppi di campioni appaiati, estratti da due popolazioni a varianza incognita.

Una scuola di atletica ha assunto un nuovo istruttore, e si vuole testare l’efficacia del nuovo tipo di allenamento proposto confrontando le medie dei tempi di 10 centometristi. Vengono riportati di seguito i tempi in secondi prima e dopo l’allenamento di ciascun atleta.

Prima dell’allenamento: 12.9, 13.5, 12.8, 15.6, 17.2, 19.2, 12.6, 15.3, 14.4, 11.3
Dopo l’allenamento: 12.7, 13.6, 12.0, 15.2, 16.8, 20.0, 12.0, 15.9, 16.0, 11.1

Siamo di fronte a due gruppi di campioni appaiati, in quanto le misurazioni sono state effettuate sugli stessi atleti prima e dopo l’allenamento. Per verificare se c’è stato un miglioramento, un peggioramento, o se le medie dei tempi sono rimaste sostanzialmente uguali (ipotesi H0), dobbiamo effettuare un test t di student per campioni appaiati, che in R si richiama così:

> a = c(12.9, 13.5, 12.8, 15.6, 17.2, 19.2, 12.6, 15.3, 14.4, 11.3)
> b = c(12.7, 13.6, 12.0, 15.2, 16.8, 20.0, 12.0, 15.9, 16.0, 11.1)
>
> t.test(a,b, paired=TRUE)

Paired t-test

data: a and b
t = -0.2133, df = 9, p-value = 0.8358
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.5802549 0.4802549
sample estimates:
mean of the differences
-0.05


Il p-value è maggiore di 0.05, quindi possiamo accettare l’ipotesi H0 di uguaglianza delle medie. In conclusione il nuovo allenamento non ha apportato nessun miglioramento (o peggioramento) significativo alla squadra di atleti.
Per conferma, calcoliamo il valore t-tabulato:

> qt(0.975, 9)
[1] 2.262157


Il valore t-calcolato è minore del valore t-tabulato, e questo ci assicura che possiamo tranquillamente accettare l’ipotesi H0.




Supponiamo adesso che il manager della squadra (alla luce dei dati ottenuti) licenzi questo allenatore che non ha apportato alcun miglioramento e ne assuma un altro, più promettente. Riportiamo i tempi degli atleti a seguito del secondo allenamento:

Prima dell’allenamento: 12.9, 13.5, 12.8, 15.6, 17.2, 19.2, 12.6, 15.3, 14.4, 11.3
Dopo il secondo allenamento: 12.0, 12.2, 11.2, 13.0, 15.0, 15.8, 12.2, 13.4, 12.9, 11.0

Adesso verifichiamo se effettivamente c’è stato un miglioramento, ossia eseguiamo un t-test per dati appaiati, specificando in R di verificare l’ipotesi alternativa H1 di miglioramento dei valori. Per far questo è sufficiente aggiungere la sintassi alt=”less” quando richiamiamo il t-test:

> a = c(12.9, 13.5, 12.8, 15.6, 17.2, 19.2, 12.6, 15.3, 14.4, 11.3)
> b = c(12.0, 12.2, 11.2, 13.0, 15.0, 15.8, 12.2, 13.4, 12.9, 11.0)
>
> t.test(a,b, paired=TRUE, alt="less")

Paired t-test

data: a and b
t = 5.2671, df = 9, p-value = 0.9997
alternative hypothesis: true difference in means is less than 0
95 percent confidence interval:
-Inf 2.170325
sample estimates:
mean of the differences
1.61


Con questa sintassi abbiamo chiesto a R di verificare se la media dei valori contenuti nel vettore a è minore (less, in inglese) della media dei valori contenuti nel vettore b. In risposta abbiamo ottenuto un p-value di gran lunga superiore a 0.05, e questo ci porta a concludere che possiamo accettare l’ipotesi H1: il nuovo allenamento ha apportato sostanziali miglioramenti alla squadra.

Se avessimo scritto: t.test(a,b, paired=TRUE, alt=”greater”), avremmo chiesto a R di verificare se la media dei valori contenuti nel vettore a è maggiore della media dei valori contenuti nel vettore b. Alla luce del risultato precedente, possiamo sospettare che otterremo un p-value molto minore rispetto a 0.05, e difatti:

> a = c(12.9, 13.5, 12.8, 15.6, 17.2, 19.2, 12.6, 15.3, 14.4, 11.3)
> b = c(12.0, 12.2, 11.2, 13.0, 15.0, 15.8, 12.2, 13.4, 12.9, 11.0)
>
> t.test(a,b, paired=TRUE, alt="greater")

Paired t-test

data: a and b
t = 5.2671, df = 9, p-value = 0.0002579
alternative hypothesis: true difference in means is greater than 0
95 percent confidence interval:
1.049675 Inf
sample estimates:
mean of the differences
1.61


Un valore di p-value inferiore a 0.05 ci porta a escludere l'ultima ipotesi H1 formulata, come del resto ci era stato confermato dal calcolo precedente.

2 commenti:

  1. buongiorno, mi sbaglio o c'è un errore nella verifica delle ipotesti? con un p>0,05 non posso rifutare H0 ????

    RispondiElimina
  2. Se p-value molto basso -> Posso rifiuto H0 accettando H1
    Se p-value alto -> NON posso rifiutare H0

    Le ipotesi Greater e less sono infatti poste sull'alternativa (quindi su H1) come spiegato nei risultati

    "alternative hypothesis: true difference in means is greater than 0"

    quindi i ragionamenti effettuati sui risultati sono da invertire.

    In particolare dove si controlla il Greater li si Accetta H1 rifiutando H0

    RispondiElimina