Correlation vs causation


Correlazione vs causalità

La correlazione denota semplicemente un'associazione, non un rapporto di causalità.

La causalità implica correlazione mentre non è vero il contrario.

Ci sono differenti tipi di causalità:

  1. Causalità diretta (X ⇒ Y)
    Una certa variabile influenza in modo diretto una seconda variabile in modo positivo o negativo.
    Ad esempio: la correlazione che esiste tra livello di istruzione (X) e stipendio (Y).

  2. Causalità inversa (X ⇐ Y)
    Una certa variabile viene influenzata in modo positivo o negativo da una seconda variabile.
    Ad esempio: la correlazione che esiste tra debiti (X) e crescita economica (Y) in uno stato.

  3. Causalità ciclica (X ⇔ Y)
    Una certa variabile viene influenzata in modo positivo o negativo da una seconda variabile che a sua volta influenza la prima.
    Ad esempio: la correlazione che esiste tra motivazione (X) e apprendimento (Y), all'aumentare dell'una aumenta anche l'altra e viceversa.

  4. Causalità a catena (X ⇒ Y ⇒ Z t.c. X ⊥ Z | Y)
    Una certa variabile influenza in modo positivo o negativo un'altra variabile che a sua volta ne influenza una terza.
    Ad esempio: la correlazione che esiste tra numero di grandinate avvenute in una certa regione vinicola (X), quantità di uva raccolta (Y) e litri di vino prodotti (Z).

  5. Causalità confusa (X ⇒ Y ⇒ Z t.c. X ⊥ Y | Z)
    Una certa variabile è correlata in modo positivo o negativo da un'altra variabile che però deve questa relazione ad una terza variabile che ne determina la causa di entrambe.
    Ad esempio: la correlazione che esiste tra numero di pompieri che intervengono in un incendio (X), grandezza dell'incendio (Y) e numero di morti in un incendio (Z), se si analizzano le variabili senza tenere conto della grandezza dell'incendio potrebbe sembrare che più pompieri intervengono più morti ci sono, ma ovviamente queste due variabili dovrebbero essere in realtà indipendenti "al netto" della dimensione dell'incendio.

  6. Causalità tautologica (X ≡ Y)
    Una certa relazione che deriva da qualche conversione.
    Ad esempio: la correlazione che esiste tra Fahrenheit (X) e Celsius (Y) o tra metri e miglia.

  7. Causalità multivariata (X ⇒ Y ⇐ Z)
    Più fattori non correlati tra loro, che influenzano una variabile.
    Ad esempio: la correlazione che esiste tra prezzo del ferro (X), prezzo del carbonio (Y) e prezzo dell'acciaio (Z), [l'acciaio è una lega di ferro e carbonio] [è il sogno di qualsiasi persona che vuole evitare problemi di collinearità, accade di rado che siano del tutto incorrelati].

  8. Causalità casuale
    Una certa relazione dovuta alla semplice coincidenza.
    Ad esempio: la correlazione che esiste tra numero di ravanelli venduti nel mondo (X) e numero di incendi in California (Y).