Cointegrazione


Articoli di approfondimento



LA COINTEGRAZIONE


Le variabili di un modello si dicono cointegrate se esiste una combinazione lineare STAZIONARIA (ricordiamo che la somma di processi stocastici è un processo stocastico) tale per cui le serie, prese singolarmente, risultano stazionarie. Se questa relazione esiste allora si dice che si ha una relazione di lungo periodo tra le variabili del modello. (infatti se considero un processo stazionario e uno integrato (non stazionario) la combinazione lineare di questi può risultare stazionaria se essi sono integrati con lo stesso ordine. Questo può avvenire se i fenomeni considerati condividono l'insieme dei fattori responsabili della non stazionarietà.)

Una serie storica multivariata Xt = [X1t, . , Xkt] è detta cointegrata se ogni singola Xit è una serie storica I(1) ed esiste almeno un vettore di pesi a' = [a1, . , ak] tale che la serie storica ottenuta come combinazione lineare di a'Xt è stazionaria.
a = è detto vettore di cointegrazione
il vettore cointegrante non è unico infatti ogni multiplo del vettore a (b*a con b che è qualsiasi scalare) è anch'esso un vettore cointegrante; in particolare per k=2 è possibili ottenere un unico vettore cointegrante mentre per k>2 è possibile ottenere h vettori cointegranti (t.c. h>k) usualmente raccolti in una matrice A detta matrice di cointegrazione.
Teorema: se la matrice A' è costituita da h vettori riga linearmenti indipendenti, A'Xt è un processo stazionario e c' è un vettore linearmente indipendente dalle righe di A', allora c' è non stazionario.

Per spiegare il sistema cointegrato si utilizza spesso la metafora dei due ubriachi:
Due ubriachi escono dal bar e si decide di osservare il percorso che compiono per raggiungere le loro abitazioni. Si indica con "t=1,2,." una misura discreta del tempo che trascorre dal momento in cui i due ubriachi lasciano il bar e siano zt e xt le due distanze dei due dal bar. Ogni passo compiuto al tempo t è descritto dalle quantità ut e vt. Il primo ubriaco a maggiori difficolta negli spostamenti in quanto ha una gamba più corta dell'altra e quindi chiede all'altro di poter camminare sottobraccio.
Date le circostanze si può assumere che il primo ubriaco cammini seguendo un percorso descritto da un random walk con drift: zt =z(t-1) + Φ + ut e che attiri a se l'amico prima di ogni passo, in modo che il punto di partenza del secondo ubriaco all'istante t sia proporzionale a quello del primo ubriaco, ossia un processo scritto come xt = γz(t-1) + vt con γ che è una cotante reale.
Il percorso seguito dei due può essere descritto come un VAR(1):

Sostituisco ricorsivamente:
Zt = ∑ti=1 (ui + Φ) + Z0 ≡ gt

Xt = γ (gt - Φ - ut) + vt



Abbiamo cosi mostrato che Xt e Zt condividono la stessa componente di non stazionarietà gt (RWD) che è in I(1) detto trend comune del sistema. Quindi il sistema [Zt Xt]T è detto cointegrato
### Metafora dei 2 ubriachi

    n <- 100
    eps <- rnorm(n);eps2 <- rnorm(n)
    z0<- x0 <- rep(0, 100)
    for (i in seq.int(2, 100)){
      # persona ubriaca zoppa
      z0[i] <- 1*z0[i-1] + 0.1 + eps[i]
      # persona ubriaca che aiuta zoppo
      x0[i] <- 0.6*z0[i-1] + eps2[i]
    }

    plot(ts(z0), col=3)
    lines(ts(x0),lty=2, col=2)
    legend("topleft",c("Ubriaco zoppo","Ubriaco che aiuta zoppo"),
           lty=c(1,2), col = c(3,2))
plot of chunk unnamed-chunk-9

L'obbiettivo della rappresentazione a correzione d'errore è di scomporre il processo cointegrato in una componente che descrive i comportamenti di lungo periodo (non stazionari) e una che descrive quelli di breve periodo (stazionari).
Consideriamo ad esempio un VAR(1) bivariato il quale deriva da due RW senza drift:
X1t = γ X2t-1 + u1t + γ u2t
X2t = X2t-1 + u2t

A questi modelli sottraggo rispettivamente X1t-1 e X2t-1 ottenendo cosi:

ΔX1t = -X1t-1 + γ X2t-1 + u1t + γ u2t
ΔX2t = u2t

Π = alla matrice dei coefficienti del modello costruito con le differenze prime.
svolgendo i calcoli con le forme matriciali ottengo che:
[ΔX1t ΔX2t]T = [-1 0]T (X1t-1-γ X2t-1) + [u1t + γ u2t u2t]T <- RAPPRESENTAZIONE A CORREZIONE D'ERRORE

dove:
In questo caso il rango della matrice Π è facile da calcolare e risulta essere 1, ma questo cosa significa?
Nel nostro caso specifico la serie risulta quindi essere cointegrata.
La matrice Π si può anche pensare come il prodotto della matrice di ritorno all'equilibri Β con la matrice di cointegrazione AT (ampiezza della deviazione dalla rilevazione di cointegrazione al tempo t-1).

La tecnica di Johansen serve per stimare la matric e Π attraverso la stima di una matrice di cointegrazione AT e della matrice dei pesi di ritorno all'equilibrio t, questo metodo si può usare nel caso in cui il rango di cointegrazione risulta essere noto. Tale metodo si divide in due step: Nel primo step si stima con il metodo dei minimi quadrati la matrice di ritorno all'equilibri Β; mentre nel secondo si stima con la stima di massima verosimiglianza la matrice di cointegrazione AT.
Nello specifico possiamo distinguere tre casi:

REGRESSIONE CONCENTRATA - sono noti sia il rango di cointegrazione sia la matrice di cointegrazione

Supponiamo h e A noti, per prima cosa si verifica, mediante i test ADF che le k variabili di Xt siano tutte I(1) poi se lo sono si calcola A'Xt e si applicano gli stessi test per verificare la stazionarietà degli h processi univariati che lo compongono; se gli h test portano al rifiuto dell'ipotesi nulla di esistenza di una radice unitaria, allora può accettarsi l'ipotesi che A sia matrice di cointegrazione.
Partiamo per la stima considerando i 2 modelli di regressione ausiliari per stimare il legame tra ΔXt e Xt-1 al netto delle altre variabili usando il teorema di Frisch-Waugh:

ΔXt = Π0 + Π1 ΔXt-1 + ... + Πp-1 ΔXt-p+1 + ut

Xt-1 = θ0 + θ1 ΔXt-1 + ... + θp-1 ΔXt-p+1 + vt

ut contiene tutte le informazioni su &Lamda;Xt al netto della componente di breve periodo, mentre vt contiene tutto ciò che Xt-1 non è spiegato dalla componente di breve periodo.
Facendo una regressione tra i residui troviamo quindi la stima di cio he cerchiamo, questo modello è conosciuto come modello di regressione concentrata:
ut = Π vt + εt =
Per comodità consideriamo:
(ut)T = (AT vt)T ΒT + (εt)T

allora possiamo stimare ΒT con il metodo dei minimi quadrati e viene che:

stima ΒT = [(AT vt)(AT vt)T]-1 (AT vt) ut

che si può anche riscrivere come:
= (AT vt vtT A)-1 AT vt ut =
dove:
Σvv = vt vtT
Σvu = vt ut


Quindi:
stima Β = (AT Σvv A)-1 A Σvu

STIMA DI A - è noto il rango di cointegrazione ma non la matrice di cointegrazione

Nel caso in cui la matrice A sia ingnota dobbiamo distinguere due casi il primo si verifica quando il rango di cointegrazione massimo k=2 (quindi un processo bivariato) e in questo caso si può utilizzare la tecnica di Engle e Granger mentre se il rango massimo è maggiore di 2 allora siamo costretti ad utilizzare la tecnica di Johansen.