sabato 1 novembre 2008

Indice degli esercizi svolti

Capitolo -1: Come funziona R



Capitolo 0: Esercizi base con R e probabilità



Capitolo 1: Inferenza statistica, verifica di ipotesi su uno o più gruppi



Capitolo 2: Studio della correlazione e della regressione



Capitolo 3: Analisi del trend (trend analysis)



Capitolo 4: Blocking design in R



Capitolo 5: Grafici con R



Capitolo 6: Approfondimenti



Capitolo 7: Cluster Analysis



Capitolo 8: Matrici e algebra lineare e matematica in generale



Capitolo 9: Non solo statistica


45 commenti:

  1. costruire l'intervallo di confidenza per la media della variabile a, di levello fiduciario 0.95.
    come si risolve col software "R"?

    RispondiElimina
  2. sempre software "R"...
    - spiegare quali ipotesi si devono fare per la validità del procedimento.
    - Testare a livello 0.05 se la media di x2 è uguale a 0.5, contro l'alternativa media diversa da 0.5.
    - Verificare le ipotesi di validità del test, specificare quale tipo di errore si potrebbe commettere nel caso studiato.

    RispondiElimina
  3. Rispondo solo alla prima domanda, perchè alle altre non posso rispondere, visto che non so qual è questo "procedimento" :)

    Sia A un vettore di dati. Tu vuoi calcolare l'intervallo di confidenza al 95%. Si fa così: calcoli la media, quindi lo standard error, quindi l'int.conf con la formula relativa:

    error <- qt(0.975,df=length(A)-1)*sd(A)/sqrt(length(A))

    left <- mean(A)-error
    right <- mean(A)+error

    RispondiElimina
  4. Sei veramente grande!
    Semplice e preciso.
    Ti ringrazio per tutte le tue spiegazioni.
    Daniele

    RispondiElimina
  5. solo alla fine della mia laurea scopro questo sito???

    accidenti a me!!!

    RispondiElimina
  6. Ciao! sto cercando di imparare ad utilizzare R. Sull'esempio di quanto hai scritto qui: http://statisticaconr.blogspot.com/2008/11/test-z-un-solo-campione.html ho creato una funzione molto simile alla tua per calcolare un test z; la differenza è nell'output a video.

    > z.test = function(a, mi, var, alpha) { zeta = (mean(a)-mi)/(sqrt(var/length(a)))
    + ttest <- qt(1-alpha/2, 10000000000000)
    + risultato <- c(zeta, ttest)
    + names(risultato) <- c("calcolato", "tabulato")
    + return(risultato)
    + }

    se do i seguenti dati come input
    > z.test(a,75,18,0.05)

    a video compare:

    calcolato tabulato
    -2.832353 1.959964

    fin qui tutto ok. Il "problema" è che io vorrei dare anche una specie di spiegazione da far comparire sotto ai valori, una frase del tipo "poichè il valore calcolato è maggiore in valore assoluto rispetto a quello tabulato..." e per questo stavo provando ad utilizzare if...else all'interno di "return", però non funziona :) evidentemente pecco di inesperienza... ho tentato anche con un secondo "return" dopo il primo, ma non succede nulla... Sapresti darmi qualche consiglio? Grazie infinite!

    PS: grande cosa questo blog! sei stato bookmarkato! ;)

    RispondiElimina
  7. ah, in merito a quanto ho scritto nel post qui sopra: quella "a" in "z.test" è il vettore di dati che hai usato tu nella pagina che ti ho indicato all'inizio del post

    RispondiElimina
  8. Ciao, allora, per far comparire una stringa di testo all'interno della funzione, prova ad usare la funzione message("testotesto").

    Per l'utilizzo dell'if..then..else, è solo un problema di programmazione e un pò di esercizio con il linguaggio. Ti ricordo che la sintassi corretta per usarlo è la seguente:
    if(condizione){ codice } else {codice}
    Questo però non devi usarlo all'interno di return(), ma creare una condizione, che se verificata ti dà un certo return e un certo messaggio, altrimenti dà un altro output.
    E' difficile da spiegare a parole XD

    Ti consiglio di visionare il codice con cui ho scritto la funzione di Cox-Stuart, in cui ho fatto all'incirca quello che chiedi tu (con altre formule ovviamente). Trovi il codice qui: http://statisticaconr.blogspot.com/2009/07/analisi-del-trend-con-il-test-di-cox.html

    Prova a studiarlo. Se non ci riesci, sono a disposizione.
    E grazie per il bookmarking :)

    RispondiElimina
  9. finalmente ho l'occasione di potermi approcciare seriamente ad R! Grazie :-)

    RispondiElimina
  10. Non so se è la pagina adatta, ma avrei bisogno di aiuto se è possibile: devo creare un lavoro su R partendo da una serie di dati http://people.sc.fsu.edu/~jburkardt/datasets/regression/x22.txt
    Come posso procedere??? grazie infinite....

    RispondiElimina
  11. @Claudio
    felice d'esserti d'aiuto :)

    @Anonimo
    si tratta di un modello di regressione lineare multipla. Prova a leggere questa pagina: http://statisticaconr.blogspot.com/2009/08/regressione-lineare-multivariata.html
    Il modello da scrivere in R è del tipo:
    B ~ A0 + A1 + A2 + ... + A6
    (le variabili sono i nomi che devi assegnare alle varie colonne)

    RispondiElimina
  12. GRazie infinite, procederò subito, poi chiederò nel caso ho bisogno. Grazie :-)

    RispondiElimina
  13. Avrei bisogno di aiuto se è possibile visto che su quel dataset ci devo fare una tesina.....mi può aiutare nel procedimento??
    Grazie infinite!!!

    RispondiElimina
  14. ciao, mandami pure una e-mail con le tue domande... cercherò di risponderti quanto prima

    RispondiElimina
  15. Partendo dal dataset che ho postato sopra io devo arrivare a fare un'analisi completa di quello e arrivare a dei risultati da spiegare.....non avendo purtroppo potuto frequentare le lezioni il mio uso di R è limitato e se sapresti aiutarmi nel procedimento dicendomi le formule da applicare te ne sarei grata!!!Grazie comunque per la disponibilità e le risposte!!!!

    RispondiElimina
  16. Sulla pagina che ti ho linkato prima, dovresti trovare tutto il procedimento spiegato per fare una analisi multilineare (le formule da applicare, un commento dei risultati come esempio, come scegliere le variabili, etc)... Se hai qualche dubbio, scrivimi quello che hai già fatto a:
    todoslogos (at) gmail (dot) com
    così magari ti posso correggere, e mi poni domande più precise (se ti servono grafici, tabelle etc), perchè così è troppo generico, e non farei altro che ripeterti il post che ti ho linkato :)

    RispondiElimina
  17. cercavo tra gli argomenti qualcosa sulla convergenza, tipo un approccio kernel, con R non saprei proprio dove mettere mano! qualcuno può aiutarmi?!? grazie

    RispondiElimina
  18. Ho bisogno di risolvere esercizi di base in r e con variabili aleatoria, chi mi può aiutare?
    Grazie

    RispondiElimina
  19. ... potete rispondere a: xhesika1@hotmail.com
    Grazie infinite

    RispondiElimina
  20. Ciao a tutti, potete gentilmente fornirmi le indicazioni per la realizzazione di un DEM con R. Le indicazioni che ho trovato nel manuale non mi sono chiare. Grezie mille!

    RispondiElimina
  21. scrivere una funzione somma diagonale 2(m)che prende in input una matrice(variabile m)e restituisce la somma dei numeri che si trovano sulla diagonale secondaria della matrice

    RispondiElimina
  22. Ciao! Potresti indicarmi la sintassi per eseguire il calcolo dell'indice di Shannon?

    RispondiElimina
  23. Ciao, per l'indice di Shannon esiste già una funzione:

    library(vegan)
    diversity(x, index = "shannon", MARGIN = 1, base = exp(1))

    Se ti serve visualizzare il codice della funzione, puoi seguire quanto spiegato qui: http://statisticaconr.blogspot.com/2010/09/come-visualizzare-il-codice-delle.html

    RispondiElimina
  24. ProbNorm(mu=172,sigma=12,a=170.1,color="red")
    scusate come si fa?

    RispondiElimina
  25. Ciao, devo studiare la relazione tra il consumo di un bene e il profilo del consumatore, l'obiettivo è una relazione multipla ma i miei dati sono di natura categorica... devo svolgere l'anova? ma le variabili sono 11 devo farla per tutte e 11?
    Per esempio bartlett.test(carne,gender)
    e l'anova?
    Mi potete aiutare!!!

    RispondiElimina
  26. ciao a tutti, devo effettuare una ridge regression.
    ho trovato un file su internet che fa un esempio di ridge regression e come comando usa:
    fmr<-lm.ridge(employed~ .+., data=longley_ita, lambda = seq(0,1,0.001))
    ma non capisco una cosa, che significato ha lambda=seq(0,1,0.001)?

    RispondiElimina
  27. ciao avrei bisogno di un aiuto per formalizzare un modello di equazioni strutturali con R.
    Devo partire da un' analisi fattoriale e poi determinare il modello secondo SEM.
    Quali sono i pacchetti disponibile su R per questo tipo di analisi?

    RispondiElimina
  28. ciao!qualcuno sa dirmi come faccio (anche con Rcommander) a calcolare le medie di pioggia annuali, avendo come dataset l'elenco dei valori di pioggia giorno per giorno, dal 1920 al 1994..grazie...

    RispondiElimina
  29. salve a tutti!ho installato il pacchetto evir , ma non sembra caricarlo.Qualcuno saprebbe dirmi come mai? ha qualche dipendenza?

    RispondiElimina
  30. Ciao a tutti, qualcuno sa dirmi se esiste una funzione in r per condurre un post hoc test sull'ANCOVA? Il tukey HSD non mi funziona. Esiste un pacchetto specifico??? Grazie

    RispondiElimina
  31. Ciao a tutti qualcuno potrebbe svolgere questo questito? Grazie mille.
    In un'officina 10 operai usano una macchina con un carico da 1kW per un'operazione svolta di 10 minuti da svolgersi ogni ora. Il lavoro degli operai non è sincrono e il momento in cui un operaio accende la macchina è indipendente dallo stato di accensione delle altre macchine. L'officina ha un contratto da 5kW, qual è la probabilità in un'ora che vada via la luce?

    RispondiElimina
  32. Ciao a tutti, data questa tabella che test devo usare?
    Verificare se il tasso di successo degli iscritti al test di ingresso del dipartimento A è uguale tra i due sesso o maggiore.
    A B C D E F
    MASCHI 825 560 325 417 191 373
    FEMMINE 108 25 593 375 393 341

    MASCHI FEMMINE
    AMMESSI 512 89
    NON AMMESSI 313 19

    RispondiElimina
  33. Ciao a tutti. Qualcuno saprebbe spiegarmi come fare un'analisi delle corrispondenze multiple con R? Ho un mio dataset che devo analizzare, mi spiegate i passi da fare?

    RispondiElimina
  34. Ciao a tutti. Qualcuno sa dirmi come si calcola mediante una funzione in R il determinante di una matrice?

    RispondiElimina
  35. mi ritrovo a dover svolgere un esercizio sulla Normale standardizzata in cui si parla di una normale con media 65 e deviazione standard 2.4, e chiede di calcolare P(X<61), P(6166... non ho idea di come si faccia, qualcuno può darmi una mano?

    RispondiElimina
  36. ciao a tutti qualcuno mi sa dire come devo fare ad accettare l'ipotesi nulla o meno nella verifica delle ipotesi?devo tenere conto degli intervalli che mi da il qnorm?

    RispondiElimina
  37. Grazie davvero, questo blog è davvero utilissimo!

    RispondiElimina
  38. salve,
    dovrei applicare il test di mann-kendall avendo a disposizione una sola serie di dati,utilizzando possibilmente R che ho appena scaricato...ho provato ad impostare la formula del test in excel ma è estremamente macchinoso dato che la serie è cosstituita da 4800 dati circa...grazie per l'eventuale e PREZIOSISSIMO aiuto che mi fornirete! :)

    RispondiElimina
  39. Buongiorno a tutti,
    mi complimento prima di tutto per il blog, che seguo assiduamente. Avrei bisogno di un consiglio, e ringrazio anticipatamente per gli eventuali aiuti. Dovrei fare una statistica su singoli valori ematologici ottenuti da 10 soggetti divisi in: 5 soggetti trattati e 5 soggetti controllo. I valori sono stati ottenuti prima e dopo un test sotto sforzo per un totale di 4 osservazioni (giorno 0, giorno 10 e così via). Mi servirebbe capire se vi fosse differenza tra controllo e trattamento, tra pre e post esercizio e tra le 4 osservazioni.
    Grazie ancora
    Federico

    RispondiElimina
  40. Ciao! avrei bisogno di un aiuto nello svolgere un esercizio con R...

    Scaricare il data file student.survey dalla libreria smssdi R (CRAN). Il dataset raccoglie risposte date da una classe di discipline sociali dell'Università della Florida a un questionario in cui venivano rilevati diversi caratteri. Obiettivo: l' attitudine religiosa (nome variabile: re) ha un' effetto sulla propensione all'attività sportiva (misurata in ore di attività fisiche settimanali, nome variabile: sp), e/o sulla ideologia politica (misurata su scala da 1 a 7, con 1= molto liberale e 7= molto conservativo, nome variabile: pi)?

    (a) Genera i grafici opportuni e riporta i valori sintetici per descrivere le distribuzioni di dati di interesse;

    (b) Verifica la normalità delle distribuzioni di attività sportiva e ideologia politica per ciascuna modalità della variabile attitudine religiosa e discuti;

    Potresti dirmi quali sono i passaggi che devo svolgere, grazie mille!!
    Gabriella

    RispondiElimina
  41. ciao a tutti R-Bloggers :)
    ho iniziato ad appassionarmi a questo modo fantastico...
    ma lo trovo alquanto difficile :D
    posso chiedere un aiuto su come creare una funzione usando FUNCTION per il calcolo di varianza, mediana, percentile 0.5 e creare una funzione di log-verosimiglianza al variare del paramentro u della distribuzione normale individuando graficamente il massimo ed applicando il tutto ad una serie di rendimenti finanziari ?
    grazie in anticipo :)

    RispondiElimina
  42. Ciao a tutti!
    Sto usando l'indice di shannon come variabile riposata del mio modello: usando una regressione lineare multipla la stima dell'intercetta, con i coefficienti quindi uguali a zero, mi risulta negativa, ma l'indice di shannon è sempre positivo!
    Cosa devo fare? Provare con un glm ha senso? Grazie mille

    RispondiElimina
  43. Ciao a tutti!

    Vorrei sapere come realizzare una curva ROC con R.

    Grazie mille

    RispondiElimina