Stima dell’intensità di un Processo di Poisson


Articoli di approfondimento

L’intensità di un processo \(\lambda\), come visto negli articoli precedenti a questa sezione “Introduzione alla Statistica Spaziale” reperibile al seguente link, costituisce il valore atteso del numero di eventi \(N(W)\) in una finestra del processo \(W\) con area pari a \(|W|\).

Notazione:

Stima dell’intensità di un Processo di Poisson omogeneo

In un processo di Poisson omogeneo \(\lambda\) corrisponde ad una funzione costante, come stimatore per l’intesità si usa:

\[ \hat \lambda = \frac{N(W)}{|W|} \]

\[Var( \hat \lambda) = \frac{Var(N(W))}{|W|^2} \]

Lo stimatore è corretto e consistente.

Stima dell’intensità di un Processo di Poisson non omogeneo

Metodi quadrat counts

  1. Si costituiscono \(m\) sottoregioni \(B_i\) \(i=1, ...,m\) di area \(|B|\)
  2. Si esegue una tassellazione regolare della regione di studio: solitamente celle quadrate di lato \(a\) t.c. \(|B|= a^2\)
  3. Per ogni \(B_i\) si contano il numero di eventi e si calcola il rapporto \[ \hat \lambda_i = \frac{N(B_i)}{|B|} \]

Con questo metodo riusciamo a creare un vettore di stime dell’intensità del processo. Se il processo è non stazionario il vettore può rappresentare una stima di \(\lambda (s)\); nel caso, invece, di processo stazionario possiamo calcolare la misura di sintesi \(\hat \lambda = \frac{\sum N(B_i)}{m \space |B|}\)

Stima kernel dell’intensità

Il problema del metodo dei quadrat cunts costituisce (come per la stima CSR attraverso i metodi grafici) la scelta di dimensione delle aree per la tassellatura, infatti poche aree \(B_i\) di grandi dimensioni tendono a lisciare troppo la superficie dell’intensità mentre molte aree di piccole dimensione tendono ad essere sparse ed irregolari.

Una possibile soluzione che questo metodo propone è di lisciare tramite Kernel le intesità locali.

Quindi si individuano \(s_1, ...,s_n\) locazioni di W in cui si verificano gli eventi (con s si intende la locazione su cui viene stimata l’intensità dove \(s \in W\) )

… Una prima soluzione:

Si crea un cerchio \(B(s,h)\) centrato in \(s\) di raggio \(h\)

Poi si esegue una stima locale dell’intensità \[\hat \lambda(s) = \frac{N(B(s,h))}{|B(s,h)|} = \frac{\sum I(\mid\mid s - s_i\mid\mid \le h)}{h^2\space \pi} \\ dove \\ I(\mid\mid s - s_i\mid\mid \le h) = \begin{cases} 0, & \mbox{if } \mid\mid s - s_i\mid\mid > h \\ 1, & \mbox{if } \mid\mid s - s_i\mid\mid \le h \end{cases} \]

Problematica di questa prima soluzione:

Effetto bordo parte del peso può “disperdersi” oltre i confini della regione di studio se questa è limitata: non si possono includere punti fuori dalla finestra W

Correzione:

Calcolare l’area togliendo la parte in più quando esce:

\[\hat \lambda(s) = \frac{N(B(s,h))}{|W \cap B(s,h)|}\]

Problematica di questa soluzione:

Effetto della correzione: “gonfiare” il numeratore, riducendo l’area a denominatore, per compensare la potenziale riduzione d’informazione per eventi “non registrati” fuori dall’area di studio nello stimare l’intensità vicino al bordo della regione

Correzione finale:

Si utilizza un sistema di “pesi” non costante ma determinato in base ad una funzione nucleo

\[\hat \lambda(s) = \frac{1}{p_k(s)} \sum_{i=1}^n \frac{1}{h^2}\space k \space \bigg(\frac{s-s_i}{h} \bigg)\]

  • dove: \(p_k(s)\) costituisce un fattore di correzione per l’effetto bordo: \[p_k(s)= \int_W \frac{1}{h^2}\space k \space \bigg(\frac{s-t}{h} \bigg) \space dt\]
  • dove: \(k(u) : R^2 \rightarrow R\) (kernel)
  • dove: \(h\) è un parametro di lisciamento

Metodi parametrici

Si supponga di parametrizzare l’intensità di un IHPP come \(\lambda(s, \theta)\) nota a meno del parametro \(\theta\).

\[ L(\theta | s_1, ...,s_n,n) \propto \prod_{i=1}^n \lambda(s_i, \theta) \exp(-\mu(W,\theta)) \]

In questi casi è sempre consigliabile ricorrere a specificazioni log-lineari per garantire la positività della funzione d’intensità

\[ l(\theta) = l(\theta | s_1, ...,s_n,n) = \sum_{i=1}^n \log \bigg(\lambda(s_i, \theta) \bigg) -\mu(W,\theta)\]

Si massimizza la log-verosimiglianza per il parametro \(\theta\)

\[ \hat \theta_{ML} = \max_\theta l(\theta) \]