Statistica con R: Test del chi-quadro per il trend (test di Armitage)

giovedì 30 luglio 2009

Test del chi-quadro per il trend (test di Armitage)

Test di verifica di un trend lineare in proporzioni e frequenze.

Supponiamo di disporre di una tabella di contingenza 2xK, ad esempio relativa al numero di cavie morte dopo somministrazione di dosi crescenti di un certo farmaco sperimentale, oppure relativa alll'incidenza di patologie in gruppi di individui appartenenti a classi di età sempre maggiori. Con il test di Armitage (Cochran-Armitage test for trend; in alcuni software come SPSS è chiamato anche Mantel-Haenszel linear-by-linear association chi-squared test) possiamo verificare se è presente o meno un trend lineare delle proporzioni. L'ipotesi nulla è la presenza di un trend lineare, contro l'ipotesi alternativa di allontanamento da esso. Vediamo come procedere analizzando la seguente tabella:

$\begin{tabular}{|c|cccc|}\hline & dose 1 & dose 2 & dose 3 & dose 4\\ \hline Morti &19&29&24&20\\ Vivi&497&580&269&147 \\ \hline Totale&516&589&293&167\\ \hline \end{tabular}$

Per prima cosa dobbiamo verificare se le proporzioni sono tra loro simili, con il test del Chi-quadro per l'indipendenza delle variabili, già presentato in questo post.

morti <- c(19, 29, 24, 20)
tot <- c(516, 589, 293, 167)
prop.test(morti, tot)

4-sample test for equality of proportions without continuity correction

data:  con out of tot 
X-squared = 19.5233, df = 3, p-value = 0.0002131
alternative hypothesis: two.sided 
sample estimates:
    prop 1     prop 2     prop 3     prop 4 
0.03682171 0.04923599 0.08191126 0.11976048

Il Chi-quadro ottenuto è pari a 19.5233, e p-value < 0.05. Quindi rifiutiamo l'ipotesi nulla di uguaglianza delle proporzioni. Le 4 proporzioni sono statisticamente differenti.

Procediamo con un test di correlazione per variabili qualitative, con il test del chi-quadro di Pearson illustrato in questo post. Procediamo in questo modo:

tabella = matrix(c(19, 29, 24, 20, 497, 580, 269, 147), nrow=2, byrow=TRUE)
chisq.test(tabella)

        Pearson's Chi-squared test

data:  tabella 
X-squared = 20.1478, df = 3, p-value = 0.0001582

Il risultato di questo test ci dice che esiste una correlazione tra le variabili. Quindi è lecito supporre un andamento lineare di queste, e perciò esaminiamo la presenza di un trend lineare con il test di Armitage:

morti <- c(19, 29, 24, 20)
tot <- c(516, 589, 293, 167)
prop.trend.test(morti, tot)

        Chi-squared Test for Trend in Proportions

data:  morti out of tot ,
 using scores: 1 2 3 4 
X-squared = 18.2109, df = 1, p-value = 1.977e-05

Abbiamo ottenuto un chi-quadro elevato, e p-value < 0.05. Rifiuto l'ipotesi nulla, e quindi posso affermare che esiste un trend lineare significativo delle proporzioni.
Abbiamo quindi individuato che la componente lineare spiega l'andamento delle proporzioni. Ma è questa l'unica spiegazione all'andamento delle proporzioni, o esiste un'altra regola sottesa? Analizziamo la deviazione dalla linearità, calcolando il chi-quadro residuo, che è pari al chi-quadro totale (cioè il chi-quadro di Pearson), meno il chi-quadro lineare (cioè il chi-quadro di Armitage):

corr <- chisq.test(tabella)
trend <- prop.trend.test(morti, tot)

chi_quadro_residuo <- corr$statistic - trend$statistic

> chi_quadro_residuo

X-squared 
 1.936932

Il chi-quadro residuo ha gradi di libertà pari a k-2, quindi 2 in questo caso. Calcoliamo quindi il chi-quadro tabulato:

> qchisq(0.950, 2)
[1] 5.991465

Poichè il chi-quadro residuo è inferiore al valore tabulato, accetto l'ipotesi nulla: la componente residua non è significativa, quindi la componente lineare è la sola a spiegare l'andamento delle proporzioni (se avessi rifiutato, significherebbe che la componente lineare non è l'unica variabile esplicativa, ma ne esistono anche altre da ricercare).

9 commenti:

Unknown24 novembre 2009 alle ore 16:03
Ciao,
penso che i dati portati in tabella colonna dose2 siano errati ( 29+580 !=589).
Davide
RispondiElimina
Risposte
Todos Logos5 dicembre 2009 alle ore 08:33
@ Davide
Hai ragione, grazie per la segnalazione. Provvedo subito ad aggiustare il tutto :)
RispondiElimina
Risposte
andrea20 luglio 2011 alle ore 18:00
Correggendo i dati, il risultato di prop.test e chisq.test è lo stesso.
Da una mail di R-help sembra non ci sia una differenza tra i due test.
Come mai li hai riportati in questa sequenza logica? Ho l'impressione che mi sfugga qualcosa...
RispondiElimina
Risposte
Anonimo8 aprile 2015 alle ore 17:20
Ciao! Probabilmente è una domanda molto stupida ma sono ancora alle prime armi con R..
Devo testare la presenza del trend su un data set composto da 6 gruppi sperimentali di numerosità diversa, per ognuno è riportato il conteggio dei tumori per tipologia e sede: esiste un modo, caricando l'intero set di dati, di non dover creare per ogni tumore la singola tabella di contingenza ed eseguire il test singolarmente??
RispondiElimina
Risposte
Anonimo14 settembre 2016 alle ore 14:37
prima si legge che "L'ipotesi nulla è la presenza di un trend lineare, contro l'ipotesi alternativa di allontanamento da esso" mentre poi si legge che "Abbiamo ottenuto un chi-quadro elevato, e p-value < 0.05. Rifiuto l'ipotesi nulla, e quindi posso affermare che esiste un trend lineare significativo delle proporzioni". C'è qualcosa che non va...
RispondiElimina
Risposte
Unknown19 aprile 2020 alle ore 14:51
in effetti, l'ipotesi nulla dovrebbe essere assenza di un trend. Probabilmente è un refuso.
RispondiElimina
Risposte

Aggiungi commento

Statistica con R

giovedì 30 luglio 2009

Test del chi-quadro per il trend (test di Armitage)

9 commenti:

Google Ads

Tag Cloud

Post più letti

Contact me at:

Blog Archive

Blog's reader info