Geostatistica: concetti introduttivi


Articoli di approfondimento

L’approccio stocastico

Le assunzioni sul fenomeno in esame son incorporate in un processo aleatorio: \[Y=\{Y(x):x \in A\}\] dove A è la regione di studio.

Si assume che il processo \(Y\) sia osservabile. Per modellizzare \(Y\) si identificano componenti che rappresentano caratteristiche rilevanti:

\[Y(x) = \mu(x) + S(x)+ W(x)\]

Dove:

\(\mu(x)\): larga scala (trend)

\(S(x)\): piccola scala: componente stocastica strutturata (segnale), questa componente è a sua volta un ogetto aleatorio ossia un processo stocastica

\(W(X)\): componente di disturbo (rumore)

Con S e W fra loro indipendenti

L’obbiettivo dell’inferenza è il segnale, S o il processo osservabile Y

Le \(n\) misurazioni di \(Y\) sono valori osservati di una traiettoria di \(Y\) negli \(n\) siti prefissati.

\[Y(x_1), ..., Y(x_n)\]

I processi stocastici spaziali

Un processo stocastico spaziale (PSS) è una collezione di variabili casuali definite su uno stesso spazio di probabilità \((\Omega,F,P)\), indicizzate da un parametro che varia in una regione di \(R^d\) (ad esempio in due dimensioni \(R^2 \rightarrow\) latitudine e longitudine).

\[S=\{ S(x): x \in A\} \\ A \subseteq R^d \\ x:indice\]

solitamente in geostatistica \(d=2\) e \(A\) è una regione limitata del piano.



Un processo stocastico spaziale è detto gaussiano se per ogni i-esimo \(x_i\) vale che: \[S(x_1),...,S(x_k) \sim N_k(\underline \mu , \Sigma)\\t.c. \\k \geq 1 \\E[S(x)]=\mu(x) \space \space \space \forall x \in A\\ Cov(S(x_i),S(x_j))= K(x_i,x_j) \space \space \space \forall x_{i,j} \in A\]

Stazionarietà e non stazionarietà

Stazionarità: La dipendenza spaziale è indipendente dalla locazione in cui la variabile è rilevata.Due misurazioni fatte allo stesso lag spaziale \(h = s − u\), tendono ad “assomigliarsi” indipendentemente dalla posizione \(s\) e \(u\).

Non stazionarietà: La dipendenza spaziale di \(S\) dipende da dove è rilevato

La stazionarietà è una proprietà importante a fini pratici: ci permette di fare inferenza

La stazionarietà è identificabile in:

  • Stazionarietà forte: un processo è stazionario in senso forte se aumentando di \(v\) (\(v \in R^d \space t.c. \space x_i +v \in A \subseteq R^d\)) ogni i-esima componente di \(x\) all’interno del processo \(S\) la distribuzione di questo non cambia.\[S(x_1),...,S(x_k) \sim S(x_1+v),...,S(x_k+v) \\k \geq 1 , \space \forall(x_1,..x_k), \space x_i \in A\subseteq R^d \\ \forall v \in R^d \space t.c. \space x_i +v \in A\]
  • Stazionarietà debole: un processo è stazionario in senso debole se il processo degli incrementi ha media nulla e se la covarianza tra una coppia di v.c. dipende da quanto siano distanti tra loro.\[E[S(x)] = E[S(x+v)] = \mu \space \space \space \space \space \forall v \in R^d \space t.c. \space x_i +v \in A \\ Cov(S(x_1),S(x_2))=Cov(S(x_1+v),S(x_2+v)) \space \space \space \space \space \forall v \in R^d \space t.c. \space x_i +v \in A, \space i=1,2\]

La stazionarietà forte implica la debole, se il processo è gaussiano le due nozione equivalgono.

Stazionarietà locale In situazioni pratiche l’assunto di stazionarietà sull’intera area di studio è difficilmente verificato.

Per stazionarietà locale si intende il fatto che le condizioni di stazionari età (del secondo ordine o intrinseca) valgano per \(|h| ≤ b (b > 0)\). In molte applicazioni reali una stazionarietà locale è ragionevole e spesso sufficiente ai fini dell’analisi (per es. in previsioni locali)


Funzione di covarianza o covariogramma

Ipotizzando \(h\) come differenza tra due vettori \(x\) e \(y\)

\[C(h)= Cov(S(x),S(x+h))\]

con \(x, x + h \in A\), ovvero la covarianza fra \(S(x)\) e \(S(y)\), \(y = x + h\) dipende solo da \(h = y - h\) (nei processi spazio temporali o anche solo nei processi temporali questa regola non vale in quanto il processo varia anche nel tempo)

Propreità:
  • Omoschedasticità:\[C(0)= Var(S(x))\geq |C(h)|\]
  • Simmetria:\[C(h) = C(-h)\]
  • La funzione \(C(h))\) è definita positiva

Funzione di correlazione o correlogramma

\[ \rho(h) = Corr(S(x),S(x+h)) \space \space \space \space x, x + h \in A\]

Relazione tra correlogramma e covariogramma: \(\rho(h)=\frac{C(h)}{C(0)}\)

Variogramma

Un diverso approccio per descrivere la dipendenza spaziale è rappresentato dal variogramma. Non è una misura di correlazione ma indica una misura di variabilità del nostro processo:

\[2 \gamma(h)= Var[S(x+h)-S(x)] \\ \gamma(h) = semi\space variogramma\]

Inoltre se \(E[S(x)]=\mu\) \(\forall x \in A\) allora \(2 \gamma(h)= E[(S(x+h)-S(x))^2]\)

Il variogramma descrive come la dissimilarità fra S(x) e S(x+h) si modifica al variare del vettore h che rappresenta il lag spaziale fra due variabili del processo aleatorio e, quindi, ne esprime il grado di regolarità spaziale. Un PSS che ammette variogramma è detto intrinsecamente stazionario.

Processi intrinsecamenti stazionari

Un processo stocastico spaziale \(S\) è intrinsecamente stazionari (anche denominati processi intrinsecamente stazionari del primo ordine) se ammette variogramma \[2\gamma(h)=Var(S(x+h)-S(x))\]

Proprietà del semi-variogramma

  • \(\gamma(h) = \gamma(-h) \rightarrow\) è una funzione pari
  • \(\gamma(h)\geq0\) con \(\gamma(0)=0\space \rightarrow\) è una funzione non negativa
  • Funzione condizionalmente definita negativa \[\forall x_1,...,x_k \space \space \space \& \space \space \space \forall a_1,...,a_k \space \space \space t.c. \space \space \space \sum_{i=1}^k a_i =0 \\ \sum_i \sum_j a_i \space a_j \space\gamma(x_i-x_j)\leq 0\]
  • Se \(S\) è un PSS debolmente stazionario allora è anche intrinsicamente stazionario

Isotropia

Un’ulteriore proprietà di invarianza di un processo stocastico spaziale molto utilizzata nelle applicazioni statistiche è l’isotropia, che prevede l’invarianza dei primi due momenti del processo rispetto a rotazioni e compressioni, oltre che a traslazioni.

La dipendenza spaziale, infatti, non dipende dalla direzione ma solo dalla distanza tra i siti.

Con isotropia si intende la proprietà dei corpi di avere le stesse caratteristiche fisiche in tutte le direzioni.

Formalmente un PSS stazionario è detto isotropico se:

\[\forall x,y \in A \space \space Cov(S(x),S(y))=C(y-x)=C^0(|y-x|) \]

vale a dire se la covarianza fra i valori del processo in due arbitrarie locazioni dipende solo dalla distanza euclidea fra queste ultime. Ciò significa che la struttura di dipendenza (misurata in termini di covarianza) del valore del processo in un dato punto rispetto ai valori della regione circostante è la stessa qualunque sia la direzione in cui ci si allontana dal punto dato.

Spiegazione in termini non formali:

In generale quando si parla di un processo isotropo o anisotropo bisogna pensare a quando si lancia un sasso in un lago con aqua calma: se il sasso è di forma regolare creerà delle onde che partono dal punto in cui esso viene a contatto con l’acqua e man mano si disperdono in tutte le direzione con la stessa intensità in questo caso il processo è definibile isotropo; se invece si lancia un sasso di forma irregolare creerà delle onde che si disperdono nelle varie direzioni con un intensità diversa.