Estadistica Espacial

download Estadistica Espacial

of 46

Transcript of Estadistica Espacial

  • 7/24/2019 Estadistica Espacial

    1/46

    XI Escuela de Probabilidad y EstadsticaCIMAT

    Estadstica Espacial

    Rogelio Ramos Quiroga

    Guanajuato, Gto. 29 de febrero de 2012.

    1

  • 7/24/2019 Estadistica Espacial

    2/46

    Una Introducci on al Tema

    2

  • 7/24/2019 Estadistica Espacial

    3/46

    Geoestadstica, version simplicada

    0 1 2 3 4 5 6

    0

    1

    2

    3

    4

    5

    6

    x

    y

    2 2 2 2 2

    2 3 3 3 2

    2 3 4 3 2

    2 3 3 3 2

    2 2 2 2 2

    1 1

    11

    0 1 2 3 4 5 6

    0

    1

    2

    3

    4

    5

    6

    Prediccin

    x

    y

    1.5 2 2.5 3 3.5

    0 1 2 3 4 5 6

    0

    1

    2

    3

    4

    5

    6

    Errores estndar de prediccin

    x

    y

    0.05 0 .1 0 .15 0 .2 0 .25 0 .3

    3

  • 7/24/2019 Estadistica Espacial

    4/46

    Geoestadstica, version simplicada

    0 1 2 3 4 5 6

    0

    1

    2

    3

    4

    5

    6

    x

    y

    2 2 2 2

    2 3 3 3 2

    2 3 4 3 2

    2 3 3 2

    2 2 2 2 2

    1 1

    11

    0 1 2 3 4 5 6

    0

    1

    2

    3

    4

    5

    6

    Prediccin

    x

    y

    0 1 2 3 4 5 6

    0

    1

    2

    3

    4

    5

    6

    Errores estndar de prediccin

    x

    y

    4

  • 7/24/2019 Estadistica Espacial

    5/46

    Aplicaciones de Estadstica Espacial

    5

  • 7/24/2019 Estadistica Espacial

    6/46

    Hidrologa

    Niveles piezometricos de un acufero. ( Cressie (1991) ).

    6

  • 7/24/2019 Estadistica Espacial

    7/46

    Procesamiento de Imagenes: Texturas

    ( Winkler (2003), Cross & Jain (1983), Geman & Geman (1984) )

    7

  • 7/24/2019 Estadistica Espacial

    8/46

    Ecologa

    Densidad de arboles (en regi on de 4 has). ( Cressie (1991) ).

    8

  • 7/24/2019 Estadistica Espacial

    9/46

    Agronoma

    ( Besag & Higdon (1999) )

    9

  • 7/24/2019 Estadistica Espacial

    10/46

    Epidemiologa

    Mapeo del riesgo de una enfermedad. Tasas de incidencia decancer de tiroides, en Francia, en el perodo 19711978.

    ( Besag, York & Mollie (1991) )

    10

  • 7/24/2019 Estadistica Espacial

    11/46

    Epidemiologa

    Prevalencia de Malaria en Gambia.

    11

  • 7/24/2019 Estadistica Espacial

    12/46

    Epidemiologa

    300 350 400 450 500 550 600

    1

    3 5 0

    1 4 0 0

    1 4 5 0

    1 5 0 0

    1 5 5 0

    1 6 0 0

    Prevalencia de Malaria en Gambia

    OE (kilmetros)

    S

    N ( k i l m

    e t r o s

    )

    Regin Oeste

    Regin Este

    Regin Central

    12

  • 7/24/2019 Estadistica Espacial

    13/46

    Pero primero, lo primero: Antecedentes

    13

  • 7/24/2019 Estadistica Espacial

    14/46

    Los inicios de la Geoestadstica

    D.G. Krige en los 1950s

    Predicci on del grado de mineral para regiones, basadas en muestreopuntual.

    Sin supuestos de i.i.d., s olo vectores de observaciones espacialmentecorrelacionadas.

    Impacto fuerte en minera.

    G. Matheron en los 1950s y 60s

    Primeras publicaciones detalladas sobre geoestadstica y kriging (acu n oeste termino en honor de Krige).

    Lder de la llamada Escuela de Fontainbleau en Francia (en la Escuelade Minas).

    14

  • 7/24/2019 Estadistica Espacial

    15/46

    Geoestadstica y Estadstica Espacial

    Geoestadstica Krige (1951) Matheron (1963)

    Estadstica Espacial Kolmogorov (1941) Matern (1960) Whittle (1962) Bartlett (1964) Besag (1974)

    Estamos hablando de lo mismo Watson (1972) Ripley (1981)

    Cressie (1993)

    15

  • 7/24/2019 Estadistica Espacial

    16/46

    Kriging

    16

  • 7/24/2019 Estadistica Espacial

    17/46

    Predicci on con Error Cuadratico Mnimo

    Sea T una variable aleatoria cuyo valor queremos predecir basandonos

    en las realizaciones de y = ( y1 , , yn ) T . Sea T = t ( y) un predictorpuntual. El Error Cuadratico Medio de T se dene como:ECM( T ) = E[( T T )2 ]

    Haciendo p = E( T |y), note que

    ECM( T ) = E y E T ( T T ) 2 |y = E y E T ( T p + p T ) 2 |y = E y E T ( T p)2 |y + E y E T ( T p) 2 |y

    = E y ( T p)2 + E y [ Var( T |y) ] E y [ Var( T |y) ]

    El predictor con mnimo error cuadratico medio es

    T = p = E( T |y) .A Var( T |y) se le llama Varianza de Predicci on .17

  • 7/24/2019 Estadistica Espacial

    18/46

    Geoestadstica Basada en Modelos

    Especicaci on del modelo:

    Proceso estacionario gaussiano S ( x) , x R 2 :

    i. E {S ( x ) } = .

    ii. Cov S ( x ) , S ( x) =

    2( || x x

    || ).

    Observaciones independendientes, yi |S ( ) N ( S ( x i) , 2 ), condi-cionadas al proceso subyacente.

    El modelo gaussiano implica que: yi = S ( x i) + ei con ei indepen-diente de S ( x i) y ei N (0 , 2 ).

    18

  • 7/24/2019 Estadistica Espacial

    19/46

    Predicci on con Error Cuadratico Mnimo

    Tambien, el modelo gaussiano implica que:

    y = ( y1 , , yn ) T N n ( 1 , 2 V )

    donde V = R + ( 2 / 2 ) I y R ij = ( || x i x j || ).

    Si deseamos efectuar una predicci on de T = S ( x) donde x esun sitio no muestreado, entonces el predictor con mnimo errorcuadratico medio es

    T = p = E( T |y)para ello necesitamos la conjunta de y y T . Puede verse que T y N 1+ n

    1 ,

    2 1 r T

    r V

    donde r = ( r 1 , , r n ) T y r i = ( || x x i || ).19

  • 7/24/2019 Estadistica Espacial

    20/46

    Recordar: Propiedades de Normal Multivariada

    Si y N ( , ) y particionamos los diferentes vectores y matricescomo

    y = y1y2, = 12

    = 11 12 21 22

    entonces, la distribuci on condicional de y1 | y2 , es Normal con

    E( y1 | y2 ) = 1 + 12 122 ( y2 2 )Var( y1 | y2 ) = 11 12 122 21

    20

  • 7/24/2019 Estadistica Espacial

    21/46

    Predicci on con Error Cuadratico Mnimo

    De las propiedades de la normal multivariada se tiene que el pre-dictor optimo (en el sentido de error cuadratico medio) es:

    T = E( T |y) = + rT V 1 ( y 1)

    y la varianza de predicci on es

    Var( T |y) = 2 (1 r T V 1 r )

    Kriging Simple : = y. Kriging Ordinario : = (1 T V 1 1) 1 1 T V 1 y.

    21

  • 7/24/2019 Estadistica Espacial

    22/46

    Predicci on Optima

    T = E( T |y) = + rT

    V 1

    ( y 1)En general, la estimaci on de no presenta gran dicultad, a un enpresencia de tendencias o covariables. Sin embargo, la parte real-mente crtica del predictor es la estimaci on de V . Los enfoquesasociados a su estimaci on dan lugar a dos escuelas en Geoes-tadstica:

    Enfoque clasico : Estimar V usando el Variograma emprico.

    Enfoque basado en modelos : Estimar V postulando modelosprobabilsticos especcos (comunmente el modelo normal) yusar las herramientas de inferencia usuales basadas en Verosimil-itud.

    22

  • 7/24/2019 Estadistica Espacial

    23/46

    Predicci on Optima

    T = E( T |y) = + rT V 1 ( y 1)

    Enfoque clasico : Kriging encontrar la combinaci on lineal de

    las observaciones y1 , , yn que mejor prediga el valor de lasupercie en una localidad arbitraria x.

    Enfoque basado en modelos : Kriging predicci on con mnimoerror cuadratico bajo supuestos de normalidad.

    23

  • 7/24/2019 Estadistica Espacial

    24/46

    Enfoque Clasico: Variogramas

    24

  • 7/24/2019 Estadistica Espacial

    25/46

    Variograma Te orico

    El variograma de un proceso y( x ) es la funci on:

    V ( x, x ) = 12 Var y( x ) y( x )

    En el caso del modelo gaussiano, se tiene, con u = || x x ||

    V ( u ) = 2 + 2 {1 ( u ) }

    V ( u ) provee un resumen de los parametros basicos de la estructura

    de un proceso espacial gaussiano.

    En la practica, cuando el diseno muestral especica una sola ob-servaci on en cada sitio, el parametro 2 tiene una doble inter-pretaci on: Como la varianza del error de medici on o como la vari-abilidad espacial a una escala menor que la distancia mas peque na

    entre puntos del dise no. Se le llama efecto Pepita (nugget) pueslos dep ositos de alto grado de mineral tienden a estar concentradosen venas.

    25

  • 7/24/2019 Estadistica Espacial

    26/46

    0 1 2 3 4 5

    0 . 0

    0 . 2

    0 . 4

    0 . 6

    0 . 8

    1 . 0

    Variograma

    u

    V ( u )

    meseta

    rango emprico

    pepita

    26

  • 7/24/2019 Estadistica Espacial

    27/46

    Variograma Emprico

    La contraparte del variograma te orico

    V ( x, x ) = 12

    Var y( x ) y( x )

    es el Variograma Emprico que consiste de la graca de puntos( u ij , vij ), donde

    u ij = || x i x j || y vij = [ y( x i) y( x j ) ] 2 / 2

    El variograma emprico suaviza la nube de puntos promediandosobre intervalos u h/ 2 uij < u + h/ 2.

    En procesos con media no-constante (e.g. cuando inclumos co-variables), el variograma se calcula sobre residuales

    r ( x i) = y( x i) ( x i)para obtener las vij s.27

  • 7/24/2019 Estadistica Espacial

    28/46

    28

  • 7/24/2019 Estadistica Espacial

    29/46

    Suiza: Datos de Lluvia (mm)

    Este Oeste

    S u r

    N o r t e

    [ 0 ,100)[100,200)[200,300)> 300

    29

  • 7/24/2019 Estadistica Espacial

    30/46

    0 50 100 150 200 250 300

    0

    5 0 0 0 0

    1 0

    0 0 0 0

    Variograma: Datos de Precipitacin

    u

    V ( u

    )

    0 50 100 150 200 250 300

    0

    5 0 0 0

    1 0 0 0 0

    1 5 0 0 0

    u

    V ( u )

    30

  • 7/24/2019 Estadistica Espacial

    31/46

    Estimaci on de parametros en base al Variograma

    Mediante el ajuste del variograma emprico al te orico se obtienenestimaciones de los parametros de la matriz de varianzas y covar-ianzas. Tpicamente se opta por un ajuste va mnimos cuadradosponderados:

    W ( ) = k n k V k V ( u k ; ) 2donde es el vector de parametros de covarianza y V k es el prome-dio de nk valores del variograma vij .

    31

  • 7/24/2019 Estadistica Espacial

    32/46

    Estimaci on de parametros en base al Variograma

    min W ( ) = k n k V k V ( uk ; )2

    con V ( u ) = 2

    + 2

    {1 ( u ) }

    Modelos mas usados:

    Exponencial : ( u ) = exp { ( u/ ) }, con 0 < 2.

    Esferico : ( u ) = 1 3 / 2 ( u/ ) + 1 / 2 ( u/ ) 3 , 0 u .

    Gaussiano : ( u ) = exp ( u/ ) 2 .

    Matern : ( u ) = 2 1 ( ) 1

    ( u/ ) K ( u/ ) .

    32

  • 7/24/2019 Estadistica Espacial

    33/46

    Comentarios

    La nube del variograma puede ser inestable, tanto a nivel pun-tual como en su forma global.

    El efecto pepita ( 2 ) es difcil de estimar pues ocurre en unextremo de la regi on de distancias alrededor del origen.

    Las ordenadas, vij , del variograma estan correlacionadas. Estopuede inducir un forma del variograma que es independientedel variograma te orico mismo.

    El ajuste es sensible a la estimacion de la media (i.e. si seajusta una tendencia o no).

    33

  • 7/24/2019 Estadistica Espacial

    34/46

    Enfoque Basado en Modelos: Maxima Verosimilitud

    34

  • 7/24/2019 Estadistica Espacial

    35/46

    La familia de funciones de correlaci on de Matern

    ( u ) = 2 1 ( ) 1 ( u/ ) K ( u/ ) , > 0 , > 0

    K ( ) : Funci on modicada de Bessel de orden .

    ( u ) = exp { ( u/ ) } corresponde a = 0 .5.

    ( u ) = exp { ( u/ ) 2 } corresponde a .

    ( u ) decrece conforme la distancia entre sitios, u, crece.

    35

  • 7/24/2019 Estadistica Espacial

    36/46

    0.0 0.2 0.4 0.6 0.8 1.0

    0 . 0

    0 . 2

    0 . 4

    0 . 6

    0 . 8

    1 . 0

    Funciones de correlacin de Matrn

    u

    (

    u )

    = 0.5, = 0.25

    = 1.5, = 0.16 = 2.5, = 0.13

    36

  • 7/24/2019 Estadistica Espacial

    37/46

    0 50 100 150 200

    2

    1

    0

    1

    Procesos gaussianos unidimensionales subyacentes

    Localidad

    S ( x )

    = 0.5, = 0.25 = 1.5, = 0.16

    = 2.5, = 0.13

    37

  • 7/24/2019 Estadistica Espacial

    38/46

    Maxima Verosimilitud

    Recordemos el modelo gaussiano: y N n ( 1 , 2 R + 2 I ), dondeR tiene elementos R ij = ( u ij ) y uij = || x i x j || .

    Mas general, incluyendo covariables,

    ( x i) =

    k

    j =1 dk( x i) k = dT i

    donde di = ( d1 ( x i) , , dk( x i)) T es un vector de covariables aso-ciado a la localidad i. Entonces el modelo gaussiano reformuladoes

    y N n ( D,2

    R + 2

    I )

    38

  • 7/24/2019 Estadistica Espacial

    39/46

    Maxima Verosimilitud

    La logverosimilitud asociada a y N n ( D, 2 R ( ) + 2 I ) es

    l( , 2,

    2, ) =

    12 C + log |

    2R ( ) +

    2I | + ( y D )

    T [

    2R ( ) +

    2I ]

    1( y D )

    Reparametrizando, 2 = 2 / 2 y haciendo V = R( ) + 2 I , te-nemos que, para V ja, el maximizador para esta dado por(mnimos cuadrados generalizados):

    ( V ) = ( D T V 1 D ) 1 D T V 1 y

    y

    2 ( V ) = ( y D )

    T V 1 ( y D ) /nLa logverosimilitud perl para y 2 queda como:l( 2 , ) =

    12 C + n log 2 ( V )+ log |V | + nla cual hay que maximizar numericamente con respecto a 2 y .

    39

  • 7/24/2019 Estadistica Espacial

    40/46

    0 50 100 150 200 250 300

    0

    5 0

    1

    0 0

    1 5 0

    2 0 0

    2 5 0

    Suiza: Precipitacin Media Predicha

    Este Oeste

    S u r

    N o r t e

    100 200 300 400

    40

  • 7/24/2019 Estadistica Espacial

    41/46

    0 50 100 150 200 250 300

    0

    5 0

    1

    0 0

    1 5 0

    2 0 0

    2 5 0

    Errores estndar de precipitacin media predicha

    Este Oeste

    S u r

    N o r t e

    20 40 60

    41

  • 7/24/2019 Estadistica Espacial

    42/46

    Predicci on de Funcionales No-Lineales

    El predictor optimo no es invariante ante transformaciones no-lineales. Una forma de abordar el problema de predicci on es vasimulaci on. Por ejemplo, si queremos predecir la probabilidad deque en cierta localidad, x, ocurra un evento de precipitaci on queexceda el umbral de 200, entonces, T , la variable aleatoria deinteres puede considerarse como una variable Bernoulli con p =P[ y( x ) > 200]. Res umenes numericos apropiados de la simulacionrepetida de S ( x ) |y nos permiten efectuar esta predicci on.

    42

  • 7/24/2019 Estadistica Espacial

    43/46

    Dist. predictiva de excedencias a 200 mm

    A200

    F r e q u e n c y

    0.36 0.38 0.40 0.42

    0

    5 0

    1 0 0

    1 5 0

    43

  • 7/24/2019 Estadistica Espacial

    44/46

    0 50 100 150 200 250 300

    0

    5 0

    1

    0 0

    1 5 0

    2 0 0

    2 5 0

    Probabilidad de exceder 200 mm

    Este Oeste

    S u r

    N o r t e

    0.2 0.4 0.6 0.8

    44

  • 7/24/2019 Estadistica Espacial

    45/46

    Comentarios Finales

    La Geoestadstica (y, consecuentemente, la Estadstica Espacial) tienen ungran campo de aplicabilidad: Meteorologa, Hidrologa, Minera, Cienciasdel Suelo, Epidemiologa, Agronoma.

    Las tecnicas estandar de interpolaci on no incorporan informaci on sobre laestructura de correlaci on espacial. La Estadstica Espacial s.

    Tpicamente, las tecnicas de interpolaci on no proveen medidas de incer-tidumbre puntual en sus ajustes. Kriging s, lo cual permite evaluar labondad de las predicciones.

    El balance se inclina hacia el uso de predicci on basada en modelos; sinembargo no son la panacea pues, por supuesto, son dependientes de lavalidez del modelo. Aunque hay herramientas para evaluar esa validez.Estimaci on basada en variogramas tiene la ventaja de ser distribution

    free, lo cual es un punto a su favor en terminos de robustez.

    45

  • 7/24/2019 Estadistica Espacial

    46/46

    Bibliografa

    1. Diggle, P.J. & Ribeiro, P.J. (2007). Model-based Geostatistics. Springer.

    2. Cressie, N. (1993). Statistics for Spatial Data. Wiley.

    3. R Development Core Team (2011). R : A language and environmentfor statistical computing. R Foundation for Statistical Computing, Vienna,Austria. ISBN 3-900051-07-0, URL http://www.R-project.org/.

    4. Ribeiro, P.J. & Diggle, P.J. (2001). geoR: A package for geostatisticalanalysis. R-NEWS, Vol.1, No.2, 15-18. ISSN 1609-3631.

    5. Tgersen, F.A. & Badsberg, J.H. (2003). Geostatistics and Spa-tial Modelling. http://gbi.agrsci.dk/statistics/courses/JBS-Geostatistics-2003/

    46