domenica 2 febbraio 2014

Boxplot con media e deviazione standard

Quando si crea un boxplot in R, automaticamente vengono rappresentati graficamente la mediana, il primo e terzo quartile (i due "hinges", ossia gli estremi del rettangolo) e l'intervallo di confidenza al 95% della mediana (gli estremi dei "notches", ossia le linee).


Tuttavia possiamo voler rappresentare graficamente la media, la deviazione standard (media + DS, media - DS) e i valori massimo e minimo.
Di seguito il codice per rappresentare graficamente, usando ggplot2 tale versione del boxplot; si aggiunge al grafico anche la rappresentazione dei singoli valori come punti, spostati grazie alla funzione jitter.


5 Commenti:

Anonimo ha detto...

ottimo..grazie 1000..era da tanto che non leggevo articoli

Todos Logos ha detto...

alla fine del codice, digitare:
print(p1)

nico ha detto...

Consiglio anche http://www.nature.com/nmeth/journal/v11/n2/full/nmeth.2811.html

Anonimo ha detto...

Ciao, devo rislovere un esercizio su R ,ma non so come si fa... ti prego di aiutarmi...
Nella guida dei ristoranti Zagat viene pubblicata una classifica dei ristoranti nelle principali città del mondo. Per ciascun ristorante viene dato un breve giudizio critico accompagnato da un punteggio in una scala da 0 a 30 attraverso il quale vengono valutati la qualità del cibo, l'arredamento/decoro, il servizio e il costo di una cena (comprensiva di una bevanda e la mancia). Tali dati sono disponibili nel data file "zagat" contenuto nella libreria "smss" di R (che andrà scaricata dal CRAN).

p.s. Si consideri che questo data file è uno di quelli utilizzati nel libro di testo, e quindi disponibili sul sito http://www.stat.ufl.edu/~aa/social/data.html

DOMANDA 1-
(a) PRODURRE DEI BOXPLOT AFFIANCATI PER LE DISTRIBUZIONI DELLE VALUTAZIONI ASSEGNATE AI RISTORANTI ITALIANI DI BOSTON, LONDRA E NEW YORK.

(b) RIASSUMERE IN UN BREVE PARAGRAFO SCRITTO LE INFORMAZIONI CHE SI POSSONO OTTENERE DA QUESTI GRAFICI, PER LE QUATTRO AREE DI VALUTAZIONE.

DOMANDA 2- PRODURRE DEGLI ISTOGRAMMI RELATIVI ALLE VARIABILI NUMERICHE CONTENUTE NEL DATA FILE. COMMENTARE EVENTUALI PROBLEMI APPLICATIVI NELL'AMBITO DELLA REGRESSIONE LINEARE.

DOMANDA 3-
(a) ESEGUIRE UN'ANALISI DELLA VARIANZA PER VERIFICARE SE LA QUALITA' DEL CIBO (variabile Food) E' SIGNIFICATIVAMENTE DIVERSA NELLE TRE CITTA' CONSIDERATE NELLO STUDIO.

(b) RICAVARE INOLTRE LA MEDIA E LA DEVIAZIONE STANDARD DELLA VARIABILE FOOD PER LE TRE CITTA' CONSIDERATE.

© CONDUCI UN'ANALISI DI CORRELAZIONE PER DESCRIVERE, PER I RISTORANTI DI BOSTON, L'ASSOCIAZIONE FRA QUALITA' DEL CIBO E DECORO, SERVIZIO E COSTO. PRODUCI INOLTRE DEI GRAFICI DI DISPERSIONE PER VISUALIZZARE TALE RELAZIONE.

questo e il sito dove si travano i data per zagat :
http://www.stat.ufl.edu/~aa/social/data.html

Anonimo ha detto...

la mia mail e w_w_t_c_y_b@hotmail.com

Posta un commento

Statistiche... del blog!

In questo blog ci sono posts e commenti.

Visualizzazioni totali (dal 01.06.2010)

Follow me on...