Come rifiutare fuori linea dati

I dati raccolti durante gli esperimenti, indagini e altre procedure di raccolta dati è di solito soggetti a una certa quantità di casualità. In alcuni casi, singole misurazioni o le risposte possono sembrare lontano il risultato atteso; questi sono valori anomali. Quando vi imbattete in un outlier, si dovrebbe verificare per determinare se è necessario respingere del tutto.

istruzione

1 Controllare il punto esterno per essere sicuri che si adatti qualitativamente con il resto dei dati. Ad esempio, se si chiede 20 persone per misurare la larghezza di una monetina, ma uno di loro misure in realtà la larghezza di un quarto, si potrebbe avere un valore anomalo nei dati. Si dovrebbe rifiutare questa outlier, perché non si adatta qualitativamente con l'esperimento.

2 Utilizzare Q-test di Dixon se non si rifiuta il valore anomalo in base al criterio nella Fase 1. Il Q-test è una misura quantitativa nelle statistiche del significato di un particolare valore relativo ad una serie di dati.

3 Determinare il livello di fiducia per il Q-test. Se si vuole essere il 90 per cento sicuri che il valore anomalo dovrebbe o non dovrebbe essere respinta, scegliere un livello di confidenza del 90 per cento.

4 Trovare il valore Q critica (Qcrit) utilizzando una tabella. È necessario conoscere il numero di valori nel set di dati (per esempio, N) e il livello di fiducia che si sceglie al punto 3.

5 Disporre il set di dati in ordine crescente. Così, per ogni valore della serie, X (i), organizzare i dati in modo che X (1) <X (2) <... <X (N - 1) <X (N).

6 Calcolare il valore di Q sperimentale (QEXP) del valore anomalo. Per i singoli valori anomali, il valore anomalo è o X (1) o X (N) nella disposizione di dati dal punto 5. I rispettivi valori di Q per questi due casi sono [X (2) - X (1)] / [X (N ) - X (1)] e [X (N) - X (N - 1)] / [X (N) - X (1)].

7 Confrontare il valore Q sperimentale dal punto 6 al valore Q critica dal punto 4. Se QEXP è maggiore di Qcrit, allora si dovrebbe rifiutare il valore anomalo. Se QEXP è inferiore a Qcrit, allora si dovrebbe tenere il valore anomalo nei dati. L'accettazione o il rifiuto del valore anomalo ha un livello di confidenza base a ciò che si è scelto al punto 3 (per esempio, si sono il 90 per cento sicuri che si dovrebbe rifiutare l'outlier).

Consigli e avvertenze

  • i livelli di fiducia più elevati portano a valori di Q superiore critici. Di conseguenza, se si vuole essere più certo che si dovrebbe rifiutare una particolare outlier, che outlier deve essere più chiaramente fuori luogo rispetto al resto dei dati.
  • Q-test di Dixon funziona meglio per le piccole dimensioni del campione. dimensioni del campione più grandi possono richiedere altri test statistici.
  • Se si dispone di più valori anomali, è necessario utilizzare un test di statistiche diverso da quello del Q-test.