Come eseguire l'analisi dei dati di base in Excel

Come eseguire l'analisi dei dati di base in Excel

La maggior parte delle volte, quando si eseguono statistiche, si desidera utilizzare un software statistico. Questi strumenti sono costruiti per fare calcoli come T -test, test chi-quadrato, correlazioni e così via. Excel non è pensato per l'analisi dei dati. Ma questo non significa che non puoi farlo.





Sfortunatamente, le funzioni statistiche di Excel non sono sempre intuitive. E di solito ti danno risultati esoterici. Quindi, invece di utilizzare le funzioni statistiche, utilizzeremo il componente aggiuntivo per le statistiche di Excel: il Analisi dei dati Toolpack.





Il Toolpak, nonostante la sua ortografia piuttosto sfortunata, include una vasta gamma di utili funzionalità statistiche. Vediamo cosa possiamo fare con le statistiche di Excel.





Aggiunta del pacchetto di strumenti per l'analisi dei dati di Excel

Mentre tu Potere fare statistiche senza Data Analysis Toolpak, è molto più facile con esso. Per installare il Toolpak in Excel 2016, vai a File > Opzioni > Componenti aggiuntivi .

Clic andare accanto a 'Gestisci: componenti aggiuntivi di Excel'.



Nella finestra risultante, seleziona la casella accanto a Strumenti di analisi e quindi fare clic su ok .

Se hai aggiunto correttamente il Data Analysis Toolpak a Excel, vedrai un Analisi dei dati pulsante nel Dati scheda, raggruppati in Analisi sezione:





Se vuoi ancora più potenza, assicurati di controllare gli altri componenti aggiuntivi di Excel.

Statistiche descrittive in Excel

Indipendentemente dal test statistico che stai eseguendo, probabilmente vorrai prima ottenere le statistiche descrittive di Excel. Questo ti darà informazioni su medie, mediane, varianza, deviazione standard ed errore, curtosi, asimmetria e una varietà di altre cifre.





L'esecuzione di statistiche descrittive in Excel è facile. Clic Analisi dei dati nella scheda Dati, seleziona Statistiche descrittive, e seleziona l'intervallo di input. Fare clic sulla freccia accanto al campo dell'intervallo di input, fare clic e trascinare per selezionare i dati e premere accedere (o fare clic sulla freccia in basso corrispondente), come nella GIF sottostante.

Successivamente, assicurati di dire a Excel se i tuoi dati hanno etichette, se desideri l'output in un nuovo foglio o sullo stesso e se desideri statistiche di riepilogo e altre opzioni.

Dopodiché, premi ok e otterrai le tue statistiche descrittive:

Test t dello studente in Excel

Il T -test è uno dei test statistici più basilari ed è facile da calcolare in Excel con Toolpak. Clicca il Analisi dei dati e scorri verso il basso fino a visualizzare il T -opzioni di prova.

Hai tre scelte:

  • t-Test: coppia di due campioni per mezzi dovrebbe essere utilizzato quando le misurazioni o le osservazioni sono state abbinate. Usalo quando hai preso due misurazioni degli stessi soggetti, come misurare la pressione sanguigna prima e dopo un intervento.
  • t-Test: due campioni assumendo varianze uguali dovrebbe essere usato quando le tue misurazioni sono indipendenti (il che di solito significa che sono state fatte su due diversi gruppi di soggetti). Discuteremo la parte delle 'varianze uguali' tra un momento.
  • t-Test: due campioni assumendo varianze diseguali è anche per misurazioni indipendenti, ma viene utilizzato quando le varianze non sono uguali.

Per verificare se le varianze dei tuoi due campioni sono uguali, dovrai eseguire un test F. Trova F-Test a due campioni per le varianze nell'elenco Strumenti di analisi, selezionalo e fai clic su ok .

Inserisci i tuoi due set di dati nelle caselle dell'intervallo di input. Lascia il valore alfa a 0,05 a meno che tu non abbia motivo di cambiarlo: se non sai cosa significa, esci. Infine, fai clic su ok .

Excel ti darà i risultati in un nuovo foglio (a meno che tu non abbia selezionato Gamma di uscita e una cella nel foglio corrente):

Stai guardando il valore P qui. Se è inferiore a 0,05, hai varianze diseguali . Quindi per eseguire il T -test, dovresti usare l'opzione per le varianze diseguali.

per eseguire un T -test, seleziona il test appropriato dalla finestra Strumenti di analisi e seleziona entrambi i set di dati nello stesso modo in cui hai fatto per il test F. Lascia il valore alfa a 0,05 e premi ok .

I risultati includono tutto ciò che è necessario segnalare per a T -test: le medie, i gradi di libertà (df), la statistica t ei valori P per i test a una e due code. Se il valore P è inferiore a 0,05, i due campioni sono significativamente diversi.

Se non sei sicuro se utilizzare una coda a una o due code T -prova, controlla questa spiegazione da UCLA .

ANOVA in Excel

Excel Data Analysis Toolpak offre tre tipi di analisi della varianza (ANOVA). Sfortunatamente, non ti dà la possibilità di eseguire i test di follow-up necessari come Tukey o Bonferroni. Ma puoi vedere se c'è una relazione tra alcune variabili diverse.

Ecco i tre test ANOVA in Excel:

  • ANOVA: Fattore Singolo analizza la varianza con una variabile dipendente e una variabile indipendente. È preferibile utilizzare più T -test quando si hanno più di due gruppi.
  • ANOVA: due fattori con replica è simile alla coppia T -test; si tratta di misurazioni multiple su singoli soggetti. La parte 'a due fattori' di questo test indica che ci sono due variabili indipendenti.
  • ANOVA: due fattori senza replica coinvolge due variabili indipendenti, ma nessuna replica nella misurazione.

Qui esamineremo l'analisi a fattore singolo. Nel nostro esempio, esamineremo tre serie di numeri, etichettati 'Intervento 1', 'Intervento 2' e 'Intervento 3'. Per eseguire un ANOVA, fare clic su Analisi dei dati , quindi seleziona ANOVA: Fattore Singolo .

Seleziona l'intervallo di input e assicurati di dire a Excel se i tuoi gruppi sono in colonne o righe. Ho anche selezionato 'Etichette nella prima riga' qui in modo che i nomi dei gruppi vengano visualizzati nei risultati.

Dopo aver colpito ok , otteniamo i seguenti risultati:

Nota che il valore P è inferiore a 0,05, quindi abbiamo un risultato significativo. Ciò significa che c'è una differenza significativa tra almeno due dei gruppi nel test. Ma poiché Excel non fornisce test per determinare quale i gruppi sono diversi, il meglio che puoi fare è guardare le medie visualizzate nel riepilogo. Nel nostro esempio, l'intervento 3 sembra che sia probabilmente quello che differisce.

Questo non è statisticamente valido. Ma se vuoi solo vedere se c'è una differenza e vedere quale gruppo probabilmente la causa, funzionerà.

L'ANOVA a due fattori è più complicata. Se vuoi saperne di più su quando usare il metodo a due fattori, vedi questo video da Sophia.org e il ' senza replica ' e ' con replica ' esempi da Real Statistics.

Correlazione in Excel

Il calcolo della correlazione in Excel è molto più semplice del T -test o un ANOVA. Utilizzare il Analisi dei dati per aprire la finestra Strumenti di analisi e selezionare Correlazione .

Seleziona il tuo intervallo di input, identifica i tuoi gruppi come colonne o righe e comunica a Excel se hai etichette. Dopodiché, premi ok .

Non otterrai alcuna misura di significatività, ma puoi vedere come ogni gruppo è correlato con gli altri. Un valore di uno è una correlazione assoluta, che indica che i valori sono esattamente gli stessi. Più vicino a uno è il valore di correlazione, più forte è la correlazione.

Regressione in Excel

La regressione è uno dei test statistici più comunemente usati nell'industria ed Excel racchiude una sorprendente quantità di potenza per questo calcolo. Eseguiremo una rapida regressione multipla in Excel qui. Se non hai familiarità con la regressione, dai un'occhiata Guida di HBR all'utilizzo della regressione per il business .

Diciamo che la nostra variabile dipendente è la pressione sanguigna e le nostre due variabili indipendenti sono il peso e l'assunzione di sale. Vogliamo vedere quale è un predittore migliore della pressione sanguigna (o se sono entrambi buoni).

Clic Analisi dei dati e seleziona Regressione . Questa volta devi fare attenzione quando compili le caselle dell'intervallo di input. Il Intervallo Y di ingresso box dovrebbe contenere la tua singola variabile dipendente. Il Intervallo di ingresso X box può includere più variabili indipendenti. Per una semplice regressione, non preoccuparti del resto (anche se ricordati di dire a Excel se hai selezionato le etichette).

Ecco come appare il nostro calcolo:

Dopo aver colpito ok , otterrai un lungo elenco di risultati. Ho evidenziato il valore P qui sia per il peso che per l'assunzione di sale:

Come puoi vedere, il valore P per il peso è maggiore di 0,05, quindi non c'è alcuna relazione significativa. Il valore P per il sale, tuttavia, è inferiore a 0,05, il che indica che è un buon predittore della pressione sanguigna.

Se hai intenzione di presentare i tuoi dati di regressione, ricorda che puoi aggiungere una linea di regressione a un grafico a dispersione in Excel. È un ottimo aiuto visivo per questa analisi.

Statistiche di Excel: sorprendentemente capaci

Sebbene Excel non sia noto per la sua potenza statistica, in realtà racchiude alcune funzionalità davvero utili, come ad esempio lo strumento PowerQuery , utile per attività come la combinazione di set di dati. (Scopri come generare il tuo primo script Microsoft Power Query.) C'è anche il componente aggiuntivo per le statistiche di Data Analysis Toolpak, che mette davvero in risalto alcune delle migliori funzionalità di Excel. Spero che tu abbia imparato a usare il Toolpak e che ora tu possa giocare da solo per capire come usare più delle sue funzioni.

la migliore stazione di ricarica per mele 3 in 1

Con questo ora sotto la cintura, porta le tue abilità di Excel al livello successivo con i nostri articoli su utilizzando la funzione di ricerca obiettivo di Excel per una maggiore elaborazione dei dati e ricerca di valori con vlookup . Ad un certo punto potresti anche voler imparare come importare i dati di Excel in Python.

Condividere Condividere Tweet E-mail Elimina questi file e cartelle di Windows per liberare spazio su disco

Hai bisogno di liberare spazio su disco sul tuo computer Windows? Ecco i file e le cartelle di Windows che possono essere eliminati in sicurezza per liberare spazio su disco.

Leggi Avanti
Argomenti correlati
  • Produttività
  • Foglio di calcolo
  • Microsoft Excel
Circa l'autore Allora Albright(506 articoli pubblicati)

Dann è un consulente di marketing e strategia dei contenuti che aiuta le aziende a generare domanda e lead. Scrive anche su strategia e content marketing su dannalbright.com.

Altro da Dann Albright

Iscriviti alla nostra Newsletter

Iscriviti alla nostra newsletter per consigli tecnici, recensioni, ebook gratuiti e offerte esclusive!

Clicca qui per iscriverti