Un istogramma è una rappresentazione grafica utilizzato per rappresentare la distribuzione di frequenza di alcuni punti dati di una variabile.
È usato nelle statistiche in cui si mostrano quante variabili di un certo tipo si verificano all’interno di intervalli specifici detti bins.
È un diagramma simile a un grafico a barre, ma rappresenta un insieme di dati continui, piuttosto che discreti. Rientra nel vasto campo statistico dell’elaborazione dei dati sperimentali
Il matematico e statistico britannico Karl Pearson inventò questo metodo di grande impatto e facile interpretazione.
Pearson spiegò che potrebbe si potrebbe usare come strumento nello studio della storia, ad esempio, per tracciare periodi di tempo storici, e ne coniò il nome nel 1891 per indicare il suo uso come “diagramma storico”
Esso consente la valutazione della distribuzione dei dati, la visualizzazione di valori anomali e la comprensione degli indici di dispersione
Alcune distribuzioni di frequenza possono essere simmetriche, il che significa che la media della distribuzione è esattamente intorno al valore medio dell’insieme di dati.
Altre distribuzioni possono non essere simmetriche. Ciò implica che il valore medio dei dati è intorno all’inizio o alla fine dell’intervallo di dati.
Costruzione di un istogramma
Per la costruzione si tracciano sul grafico due linee perpendicolari. L’asse delle ordinate indica la frequenza
Dai dati disponibili costruire intervalli adatti anche se conviene, per facilità di lettura, che ogni intervallo abbia la stessa dimensione.
Solo in questo caso l’altezza di ogni rettangolo rappresenta la frequenza. La frequenza è infatti rappresentata dall’area del rettangolo ma, a parità di base, l’altezza indica la frequenza.
Un motivo per cui l’altezza delle barre è spesso valutata erroneamente come indicazione della frequenza è dovuto al fatto che molti istogrammi hanno spesso barre equidistanti e, in queste circostanze, l’altezza del rettangolo riflette la frequenza.
Si supponga di disporre di dati relativi al pagamento di un lavoratore per ogni ora lavorata
Tabella
Lavoratori | Pagamento per ora di lavoro in euro |
1 | 20 |
2 | 21 |
3 | 24 |
4 | 50 |
5 | 54 |
6 | 55 |
7 | 60 |
8 | 77 |
9 | 80 |
10 | 85 |
11 | 87 |
12 | 90 |
13 | 91 |
14 | 102 |
Scegliendo un intervallo di base 26 si hanno:
3 lavoratori nel primo intervallo, 1 nel secondo, 4 nel terzo e 6 nel quarto.
L’istogramma corrispondente a questo insieme di dati è rappresentato in figura