Big data: desa os y oportunidades para la economia y las ... · Big data: desa os y oportunidades...
Transcript of Big data: desa os y oportunidades para la economia y las ... · Big data: desa os y oportunidades...
![Page 1: Big data: desa os y oportunidades para la economia y las ... · Big data: desa os y oportunidades para la economia y las ciencias sociales Walter Sosa Escudero Universidad de San](https://reader030.fdocuments.in/reader030/viewer/2022040607/5ebd09026ae5956b696eee8d/html5/thumbnails/1.jpg)
Big data: desafios y oportunidades para laeconomia y las ciencias sociales
Walter Sosa Escudero
Universidad de San Andres y CONICET
[email protected] • @wsosaescudero • waltersosa.weebly.com
![Page 2: Big data: desa os y oportunidades para la economia y las ... · Big data: desa os y oportunidades para la economia y las ciencias sociales Walter Sosa Escudero Universidad de San](https://reader030.fdocuments.in/reader030/viewer/2022040607/5ebd09026ae5956b696eee8d/html5/thumbnails/2.jpg)
Walter Sosa-Escudero Big Data
![Page 3: Big data: desa os y oportunidades para la economia y las ... · Big data: desa os y oportunidades para la economia y las ciencias sociales Walter Sosa Escudero Universidad de San](https://reader030.fdocuments.in/reader030/viewer/2022040607/5ebd09026ae5956b696eee8d/html5/thumbnails/3.jpg)
Walter Sosa-Escudero Big Data
![Page 4: Big data: desa os y oportunidades para la economia y las ... · Big data: desa os y oportunidades para la economia y las ciencias sociales Walter Sosa Escudero Universidad de San](https://reader030.fdocuments.in/reader030/viewer/2022040607/5ebd09026ae5956b696eee8d/html5/thumbnails/4.jpg)
Walter Sosa-Escudero Big Data
![Page 5: Big data: desa os y oportunidades para la economia y las ... · Big data: desa os y oportunidades para la economia y las ciencias sociales Walter Sosa Escudero Universidad de San](https://reader030.fdocuments.in/reader030/viewer/2022040607/5ebd09026ae5956b696eee8d/html5/thumbnails/5.jpg)
Walter Sosa-Escudero Big Data
![Page 6: Big data: desa os y oportunidades para la economia y las ... · Big data: desa os y oportunidades para la economia y las ciencias sociales Walter Sosa Escudero Universidad de San](https://reader030.fdocuments.in/reader030/viewer/2022040607/5ebd09026ae5956b696eee8d/html5/thumbnails/6.jpg)
Pobreza en Rwanda (predecir)
Walter Sosa-Escudero Big Data
![Page 7: Big data: desa os y oportunidades para la economia y las ... · Big data: desa os y oportunidades para la economia y las ciencias sociales Walter Sosa Escudero Universidad de San](https://reader030.fdocuments.in/reader030/viewer/2022040607/5ebd09026ae5956b696eee8d/html5/thumbnails/7.jpg)
Precios en Argentina (medir)
Walter Sosa-Escudero Big Data
![Page 8: Big data: desa os y oportunidades para la economia y las ... · Big data: desa os y oportunidades para la economia y las ciencias sociales Walter Sosa Escudero Universidad de San](https://reader030.fdocuments.in/reader030/viewer/2022040607/5ebd09026ae5956b696eee8d/html5/thumbnails/8.jpg)
Impuesto a las ventas en EEUU (efecto causal)
Walter Sosa-Escudero Big Data
![Page 9: Big data: desa os y oportunidades para la economia y las ... · Big data: desa os y oportunidades para la economia y las ciencias sociales Walter Sosa Escudero Universidad de San](https://reader030.fdocuments.in/reader030/viewer/2022040607/5ebd09026ae5956b696eee8d/html5/thumbnails/9.jpg)
Small vs. Big data
Small data (estadistica clasica)
Extraer lo maximo de pocos datos
Solucion: estructruar los datos (muestreo)
Enfoque: muestreo complejo aproxima muestreo al azar (lentoy caro, pero bueno).
Big data
Muchos datos (Volumen)
Muchos datos no estructurados (Variedad)
Muchos datos no estructurados e immediatos (Velocidad)
‘Condicionalmente baratos’.
Walter Sosa-Escudero Big Data
![Page 10: Big data: desa os y oportunidades para la economia y las ... · Big data: desa os y oportunidades para la economia y las ciencias sociales Walter Sosa Escudero Universidad de San](https://reader030.fdocuments.in/reader030/viewer/2022040607/5ebd09026ae5956b696eee8d/html5/thumbnails/10.jpg)
Machine/statistical learning vs estadistica clasica
Y = f(X) + u
Estadistica clasica:
Interes en f(.). Efecto causal
Modelo: Teoria, experimento.
Probabilidades (error estandar, tests)
Bueno?: insesagdo, varianza minima, inferencia valida.
Walter Sosa-Escudero Big Data
![Page 11: Big data: desa os y oportunidades para la economia y las ... · Big data: desa os y oportunidades para la economia y las ciencias sociales Walter Sosa Escudero Universidad de San](https://reader030.fdocuments.in/reader030/viewer/2022040607/5ebd09026ae5956b696eee8d/html5/thumbnails/11.jpg)
Y = f(X) + u
Machine learning:
Interes en Y : predecir, clasificar, medir.
Modelo: modelo?. Lo aprendemos.
Prediccion puntual (no inferencia).
Bueno?: Performance predictiva fuera de la muestra.
Walter Sosa-Escudero Big Data
![Page 12: Big data: desa os y oportunidades para la economia y las ... · Big data: desa os y oportunidades para la economia y las ciencias sociales Walter Sosa Escudero Universidad de San](https://reader030.fdocuments.in/reader030/viewer/2022040607/5ebd09026ae5956b696eee8d/html5/thumbnails/12.jpg)
Ejemplo: Ridge / LASSO
L(β) =∑
(yi − xiβ)2 + λ β2
λ = 0 de vuelta a MCO.
λ 6= 0 sesgado pero...
... siempre le puede ganar a MCO en terminos de prediccion.
Sesgo: pecado mortal.
ML: sesgo puede reducir la varianza dramaticamente.
Puede lidiar con K > n (la regla mas que la excepcion en bigdata).
Esto es ridge. LASSO reemplaza β2 por |β|.
Walter Sosa-Escudero Big Data
![Page 13: Big data: desa os y oportunidades para la economia y las ... · Big data: desa os y oportunidades para la economia y las ciencias sociales Walter Sosa Escudero Universidad de San](https://reader030.fdocuments.in/reader030/viewer/2022040607/5ebd09026ae5956b696eee8d/html5/thumbnails/13.jpg)
Evaluacion de modelos
Etiqueta estadistica: ex-ante. Teoria, identificacion‘limpia’(consistencia). Inferencia robusta.
Machine learning: ex-post, iterativa. Cross validation.
Machine learning construye el modelo mas que lo estima, enbase a la performance predictiva fuera de la muestra. Adios alR2 (y a MCO? Mmm...).
Walter Sosa-Escudero Big Data
![Page 14: Big data: desa os y oportunidades para la economia y las ... · Big data: desa os y oportunidades para la economia y las ciencias sociales Walter Sosa Escudero Universidad de San](https://reader030.fdocuments.in/reader030/viewer/2022040607/5ebd09026ae5956b696eee8d/html5/thumbnails/14.jpg)
Desafios
Dependencias (realmente tenemos big data?. Trump effect)
Choice based sampling.
Contrafactuales nunca se observan (podemos tener todos losdatos?).
Falacia de la correlacion.
Transparencia / privacidad.
Comunicabilidad. Caja negra (deep learning, forests, etc.)
Consenso social/politico.
Walter Sosa-Escudero Big Data
![Page 15: Big data: desa os y oportunidades para la economia y las ... · Big data: desa os y oportunidades para la economia y las ciencias sociales Walter Sosa Escudero Universidad de San](https://reader030.fdocuments.in/reader030/viewer/2022040607/5ebd09026ae5956b696eee8d/html5/thumbnails/15.jpg)
Oportunidades
More data: Big data no es solo muchos sino mas datos (pocoso muchos).
Identificar la complejidad/heterogeneidad. No linealidades.Maldicion de la dimensionalidad.
Rapido (crucial para la politica). Google Flu Trends. Pricescrapping.
Oportunidad para disenar experimentos.
Complementa a las estadisticas oficiales (no reemplaza).
Cobertura (Rwanda). Rural vs. urbano, etc..
Walter Sosa-Escudero Big Data
![Page 16: Big data: desa os y oportunidades para la economia y las ... · Big data: desa os y oportunidades para la economia y las ciencias sociales Walter Sosa Escudero Universidad de San](https://reader030.fdocuments.in/reader030/viewer/2022040607/5ebd09026ae5956b696eee8d/html5/thumbnails/16.jpg)
Nexos
Walter Sosa-Escudero Big Data
![Page 17: Big data: desa os y oportunidades para la economia y las ... · Big data: desa os y oportunidades para la economia y las ciencias sociales Walter Sosa Escudero Universidad de San](https://reader030.fdocuments.in/reader030/viewer/2022040607/5ebd09026ae5956b696eee8d/html5/thumbnails/17.jpg)
Nexos
Walter Sosa-Escudero Big Data
![Page 18: Big data: desa os y oportunidades para la economia y las ... · Big data: desa os y oportunidades para la economia y las ciencias sociales Walter Sosa Escudero Universidad de San](https://reader030.fdocuments.in/reader030/viewer/2022040607/5ebd09026ae5956b696eee8d/html5/thumbnails/18.jpg)
Nexos
Walter Sosa-Escudero Big Data
![Page 19: Big data: desa os y oportunidades para la economia y las ... · Big data: desa os y oportunidades para la economia y las ciencias sociales Walter Sosa Escudero Universidad de San](https://reader030.fdocuments.in/reader030/viewer/2022040607/5ebd09026ae5956b696eee8d/html5/thumbnails/19.jpg)
Referencias
Survey I: Varian, H. R., 2014, Big data: New tricks for econometrics,Journal of Economic Perspectives, 28(2), 3-27.
Survey II: Einav, L., and Levin, J., 2014, Economics in the age of bigdata. Science, 346(6210).
Libro simple: James, G., Witten, D., Hastie, T., and Tibshirani, R.(2013). An introduction to statistical learning. New York: Springer.
Libro: Murphy, K., 2012, Machine Learning: a Probabilistic Perspective, ,MIT Press, Cambridge.
Predicciones: Blumenstock, J., Cadamuro, G., and On, R., 2015,Predicting poverty and wealth from mobile phone metadata. Science,350(6264), 1073-1076.
Walter Sosa-Escudero Big Data
![Page 20: Big data: desa os y oportunidades para la economia y las ... · Big data: desa os y oportunidades para la economia y las ciencias sociales Walter Sosa Escudero Universidad de San](https://reader030.fdocuments.in/reader030/viewer/2022040607/5ebd09026ae5956b696eee8d/html5/thumbnails/20.jpg)
Mediciones: Cavallo, A. and Rigobon, R. 2016, The Billion Prices Project:Using Online Prices for Measurement and Research, Journal of EconomicPerspectives, Vol. 30, 2, pp.151-78.
Causal: Athey, S., and G. Imbens (2015), Machine Learning Methods forEstimating Heterogeneous Causal Effects, NBER working paper.
Politica: Kleinberg, J., Ludwig, J., Mullainathan, S., and Obermeyer, Z.,2015, Prediction policy problems. The American Economic Review,105(5), 491-495.
Econometria: Belloni, A., V. Chernozhukov, and C. Hansen, 2014,High-Dimensional Methods and Inference on Structural and TreatmentEffects, Journal of Economic Perspectives, 28(2): 29-50.
Proyecto: Statistical and machine learning for econometricians, SosaEscudero, W. y Sarmiento, I. (2017).
Walter Sosa-Escudero Big Data