INSTITUTO POLITÉCNICO NACIONAL ESCUELA …nbaloian/DSS-DCC/Esp/2_2.pdfaccesibles para operaciones...

35
1 INSTITUTO POLITÉCNICO NACIONAL ESCUELA SUPERIOR DE CÓMPUTO MANEJO DE DATOS M. EN C. EDUARDO BUSTOS FARÍAS

Transcript of INSTITUTO POLITÉCNICO NACIONAL ESCUELA …nbaloian/DSS-DCC/Esp/2_2.pdfaccesibles para operaciones...

Page 1: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …nbaloian/DSS-DCC/Esp/2_2.pdfaccesibles para operaciones QTransforma datos de operación a formas relacionadas QSolo los datos requeridos

1

INSTITUTO POLITÉCNICO NACIONALESCUELA SUPERIOR DE CÓMPUTO

MANEJO DE DATOS

M. EN C. EDUARDO BUSTOS FARÍAS

Page 2: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …nbaloian/DSS-DCC/Esp/2_2.pdfaccesibles para operaciones QTransforma datos de operación a formas relacionadas QSolo los datos requeridos

2

Almacenando datos, Acceso, Análisis, Explotación, y Visualización

Fundación del MSSMuchos conceptos nuevos Bases de datos orientadas a objetosBases de datos inteligentesAlmacén de datosExplotación de datos Evaluación analítica en líneaMultidimensionalInternet / Intranet / Web

Page 3: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …nbaloian/DSS-DCC/Esp/2_2.pdfaccesibles para operaciones QTransforma datos de operación a formas relacionadas QSolo los datos requeridos

3

Almacén de datos, Acceso, Análisis, y Visualización

¿Qué hacer con todos los datos que han sido recopilados, almacenados, organizados y usados? (¡Sobrecarga de información!)

SoluciónAlmacenando datos Acceso a datos Explotación de datosEvaluación analítica en línea(OLAP)Visualización de datosFuente de datos

Page 4: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …nbaloian/DSS-DCC/Esp/2_2.pdfaccesibles para operaciones QTransforma datos de operación a formas relacionadas QSolo los datos requeridos

4

Naturaleza y fuente de los datos

Datos: Puros

Información: Expresar el sentido de los datos organizados

Conocimiento:Datos organizados y procesados para transportar su entendimiento, experiencia, aprendizaje acumulado y pericia

Page 5: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …nbaloian/DSS-DCC/Esp/2_2.pdfaccesibles para operaciones QTransforma datos de operación a formas relacionadas QSolo los datos requeridos

5

Elementos de datos del DSS

DocumentosIlustracionesMapasSonidosanimacionesVídeos

Puede ser duro o suave

Page 6: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …nbaloian/DSS-DCC/Esp/2_2.pdfaccesibles para operaciones QTransforma datos de operación a formas relacionadas QSolo los datos requeridos

6

Fuentes de Datos

InternasExternasPersonales

Page 7: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …nbaloian/DSS-DCC/Esp/2_2.pdfaccesibles para operaciones QTransforma datos de operación a formas relacionadas QSolo los datos requeridos

7

Colección de datos, Problemas, y Calidad

Calidad: determina la utilidad de los datos– Calidad intrínseca de los datos– Accesibilidad de los datos– Representación de la calidad de los datos

Page 8: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …nbaloian/DSS-DCC/Esp/2_2.pdfaccesibles para operaciones QTransforma datos de operación a formas relacionadas QSolo los datos requeridos

8

Emisión de calidad en el almacén de datos

Uniformidad Versión Revisar lo incompleto Revisar la conformidadRevisar la jerarquía de los datos

Page 9: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …nbaloian/DSS-DCC/Esp/2_2.pdfaccesibles para operaciones QTransforma datos de operación a formas relacionadas QSolo los datos requeridos

9

El Internet y los Servicios Comerciales de Bases de Datos

Para datos externos La Internet: más sustitutos de datos externos

Bancos de Datos Comerciales: vender el acceso a bases de datos especializadas

Puede añadir datos externos a el MSS de una manera oportuna a un costo razonable

Page 10: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …nbaloian/DSS-DCC/Esp/2_2.pdfaccesibles para operaciones QTransforma datos de operación a formas relacionadas QSolo los datos requeridos

10

El Internet y Los Servidores de Bases de Datos Comerciales

Usar Web Browsers para

Acceso a información vital a empleados y clientesImplementar sistemas de información ejecutivaSistemas de Implementación para soporte en Grupo (GSS)Los Sistemas de Administración de Bases de Datos proveen datos en el HTML, directamente en los servidores web

Page 11: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …nbaloian/DSS-DCC/Esp/2_2.pdfaccesibles para operaciones QTransforma datos de operación a formas relacionadas QSolo los datos requeridos

11

Sistemas de Administración de Bases de Datos en el DSS

DBMS: Software para entrada de información a una base de datos; actualizando, borrando, manipulando, almacenando, y recuperando informaciónUn DBMS + lenguaje de modelaje para el desarrollo del DSS

El DBMS opera GRANDES cantidades de información

Page 12: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …nbaloian/DSS-DCC/Esp/2_2.pdfaccesibles para operaciones QTransforma datos de operación a formas relacionadas QSolo los datos requeridos

12

Estructura y Organización de Bases de Datos

Bases de datos relacionalesBases de datos jerárquicas Bases de datos en cadenaBases de datos orientadas a objetosBases de datos basadas en multimediaBases de datos basadas en documentosBases de datos inteligentes

Page 13: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …nbaloian/DSS-DCC/Esp/2_2.pdfaccesibles para operaciones QTransforma datos de operación a formas relacionadas QSolo los datos requeridos

13

Almacén de Datos

Separación física de los ambientes de operación y apoyo de decisionesPropuesta: establecer un almacén de datos haciéndolos más accesibles para operacionesTransforma datos de operación a formas relacionadasSolo los datos requeridos para el soporte a la decisión vienen del TPSLos datos son transformados e integrados a estructuras consistentesAlmacén de datos (almacenando información): resuelve los problemas a acceso de datosEl desempeño ad hoc a la duda, reporta el análisis y su visualización

Page 14: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …nbaloian/DSS-DCC/Esp/2_2.pdfaccesibles para operaciones QTransforma datos de operación a formas relacionadas QSolo los datos requeridos

14

Beneficios del Almacén de DatosIncrementar el conocimiento en su productividadSoportar todos los requerimientos del que toma decisionesProvee un acceso dispuesto a datos críticosAislar operaciones de bases de datos ad hoc al procesamientoProvee información en resumen de alto-nivelProvee capacidades drill down

Producciones– Conocimiento de negocios mejorado– Una ventaja competitiva– Aumenta la satisfacción y el servicio del cliente– Facilita la toma de decisiones– Ayuda a racionalizar los procesos de negocios

Page 15: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …nbaloian/DSS-DCC/Esp/2_2.pdfaccesibles para operaciones QTransforma datos de operación a formas relacionadas QSolo los datos requeridos

15

Arquitectura y Procesos del Almacén de Datos

Arquitectura de dos nivelesArquitectura de tres niveles

Page 16: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …nbaloian/DSS-DCC/Esp/2_2.pdfaccesibles para operaciones QTransforma datos de operación a formas relacionadas QSolo los datos requeridos

16

Componentes del Almacén de Datos

Una base de daros física grandeAlmacén de datos lógicosMercado de datosSistema de Soporte de Decisión (DSS) y sistemas ejecutivos de información (EIS)

Puede alimentar a OLAP

Page 17: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …nbaloian/DSS-DCC/Esp/2_2.pdfaccesibles para operaciones QTransforma datos de operación a formas relacionadas QSolo los datos requeridos

17

Aptitud del DW

Para organizaciones dondeLos datos están en diferentes sistemasInformación basada en la aproximación de dirección en usoUna amplia gama de clientesLos mismos datos tienen diferentes representaciones en diferentes sistemasFormatos de datos desastrosos, altamente técnicos

Page 18: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …nbaloian/DSS-DCC/Esp/2_2.pdfaccesibles para operaciones QTransforma datos de operación a formas relacionadas QSolo los datos requeridos

18

Características del Almacén de Datos

1. Datos organizados por detalles sujetos a información relevante para el apoyo de decisiones

2. Integración de datos

3. Variables de tiempo

4. Datos volátiles

Page 19: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …nbaloian/DSS-DCC/Esp/2_2.pdfaccesibles para operaciones QTransforma datos de operación a formas relacionadas QSolo los datos requeridos

19

OLAP: Acceso y Explotación de Datos,

Interrogantes y Análisis

Evaluación analítica en línea (OLAP)

– La informática EIS y DSS hecha por usuarios en conectados en sistemas en línea

– Contra el proceso de transacciones en línea (OLTP)

Page 20: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …nbaloian/DSS-DCC/Esp/2_2.pdfaccesibles para operaciones QTransforma datos de operación a formas relacionadas QSolo los datos requeridos

20

Actividades del OLAP

Generando dudas

Solicitando reportes

Conduciendo análisis estadísticos entre otros

Desarrollo de aplicaciones multimedia

Page 21: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …nbaloian/DSS-DCC/Esp/2_2.pdfaccesibles para operaciones QTransforma datos de operación a formas relacionadas QSolo los datos requeridos

21

OLAP usa almacenes de datos y una serie de herramientas,

usualmente con capacidades multidimensionales

Herramientas de interrogante

Hojas de cálculo

Herramientas de explotación de datos

Herramientas de visualización de datos

Page 22: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …nbaloian/DSS-DCC/Esp/2_2.pdfaccesibles para operaciones QTransforma datos de operación a formas relacionadas QSolo los datos requeridos

22

Usando SQL para interrogantes

SQL (Lenguaje de Consultas Estructurado)

Lenguaje de datos

Parecido al inglés, no procedimental, amistoso para los usuarios

Lenguaje de formato libre

Ejemplo:SELECT Nombre, SalarioFROM EmpleadosWHERE Salario >2000

Page 23: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …nbaloian/DSS-DCC/Esp/2_2.pdfaccesibles para operaciones QTransforma datos de operación a formas relacionadas QSolo los datos requeridos

23

Explotación de Datos

Descubrimiento del conocimiento en base de datosExtracción de conocimientoArqueología de datosExploración de datosProcesamiento del patrón de datosRastreando datosCosechando información

Page 24: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …nbaloian/DSS-DCC/Esp/2_2.pdfaccesibles para operaciones QTransforma datos de operación a formas relacionadas QSolo los datos requeridos

24

Minería de datos: características y objetivos

Los datos están enterrados profundamenteArquitectura Cliente/ servidorNuevas herramientas sofisticadas—incluyendo visualización avanzada—las herramientas ayudan a remover información El usuario final está autorizado para investigar los datos y utilizar otras herramientas con pocas o ninguna habilidadde programaciónCon frecuencia involucra hallazgos de resultados inesperadosLas herramientas son fácilmente combinadas con hojas de cálculo, etc.Procesamiento en paralelo para explotación de datos

Page 25: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …nbaloian/DSS-DCC/Esp/2_2.pdfaccesibles para operaciones QTransforma datos de operación a formas relacionadas QSolo los datos requeridos

25

Áreas de Aplicación de la Minería de Datos

MercadotecniaBancaRemates y ventasManufactura y producciónBancarrota y seguridad en el comercioPólizasHardware y softwareGobierno y defensaAerolíneasCuidado de la saludTransmisión de datosAplicación de la ley

Page 26: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …nbaloian/DSS-DCC/Esp/2_2.pdfaccesibles para operaciones QTransforma datos de operación a formas relacionadas QSolo los datos requeridos

26

Minería Inteligente de DatosUsar una búsqueda inteligente para descubrir infamación dentro del almacén de datos que duda y reporta y no puede ser efectivamente revelado

Encontrar patrones en los datos e inferir reglas de ellos

Usar patrones y reglas para guiar y pronosticar en la toma de decisiones

Cinco tipos comunes de información que puede ser producida por explotación de datos: 1)asociación, 2) secuencias, 3) clasificaciones, 4) grupos y 5) pronósticos

Page 27: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …nbaloian/DSS-DCC/Esp/2_2.pdfaccesibles para operaciones QTransforma datos de operación a formas relacionadas QSolo los datos requeridos

27

Herramientas Importantes Usadas en la Minería Inteligente de DatosCasos basados en el razonamiento

Redes Neuronales

Agentes inteligentes

Otras herramientas– Árboles de decisión– Reglas de inducción– Visualización de datos

Page 28: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …nbaloian/DSS-DCC/Esp/2_2.pdfaccesibles para operaciones QTransforma datos de operación a formas relacionadas QSolo los datos requeridos

28

Visualización de Datos y Multidimensionalidad

Tecnologías de visualización de datosImágenes digitalesSistemas de información geográficaInterfases de usuario graficasMultidimensionalesTablas y gráficasRealidad virtualPresentacionesAnimaciones

Page 29: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …nbaloian/DSS-DCC/Esp/2_2.pdfaccesibles para operaciones QTransforma datos de operación a formas relacionadas QSolo los datos requeridos

29

Multidimensional3-D + Hojas de cálculo (como OLAP )Los datos pueden ser organizados en la forma en que a los directores les gusta verlos, más bien en la forma en que analizan los sistemasDiferentes presentaciones de los mismos datos arreglados fácil y rápidamenteDimensiones: productos, gente en venta, mercados, unidades de negocios, localizaciones geográficas, canales de distribución, país e industriaMedida: dinero, volumen de ventajas, head count, inventario, beneficio, lo actual contra lo pronosticadoTiempo: diariamente, semanalmente, mensualmente, o anualmente

Page 30: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …nbaloian/DSS-DCC/Esp/2_2.pdfaccesibles para operaciones QTransforma datos de operación a formas relacionadas QSolo los datos requeridos

30

Limitaciones Multidimensionales

Requerimientos extras de almacenamientoCosto más altoSistemas de investigación y tiempo consumidoInterfases más complejas y mantenimiento

La multidimensional es especialmente popular en los sistemas de información ejecutiva y sistemas de apoyo a la toma de decisiones

Page 31: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …nbaloian/DSS-DCC/Esp/2_2.pdfaccesibles para operaciones QTransforma datos de operación a formas relacionadas QSolo los datos requeridos

31

Sistemas de Información Geográfica (GIS)

Un sistema basado en computadora, para capturar, almacenar, revisar, integrar, manipular, y desplegar datos usando mapas digitalizadosBases de datos espacialmente-orientadasÚtil en el mercado, ventas, estimación de votos, planeando la distribución del productoDisponible vía InternetPuede usarse con GPS

Page 32: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …nbaloian/DSS-DCC/Esp/2_2.pdfaccesibles para operaciones QTransforma datos de operación a formas relacionadas QSolo los datos requeridos

32

Realidad Virtual

Un ambiente y/o tecnología generada artificialmente suficiente para engendrar en algunos usuarios suspensiones espontáneas de incredulidadPuede compartir datos e interactuarPuede analizar datos creando un paisajeÚtil en el mercado, prototipos y diseños de naves espacialesVR en la Internet a través de VRML

Page 33: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …nbaloian/DSS-DCC/Esp/2_2.pdfaccesibles para operaciones QTransforma datos de operación a formas relacionadas QSolo los datos requeridos

33

Negocios Inteligentes en Internet

Puede capturar y analizar datos de InternetDesarrollo de herramientas en Internet

Page 34: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …nbaloian/DSS-DCC/Esp/2_2.pdfaccesibles para operaciones QTransforma datos de operación a formas relacionadas QSolo los datos requeridos

34

ResumenDatos para la toma de decisiones viene de fuentes internas y externasEl sistema de administración de bases de datos es uno de los componentes importantes de la mayoría de los sistemas de apoyo administrativoConocimientos de los desarrollos más lentos Contener datos de información si pueden sacarlosLas organizaciones son almacenes para la explotación de datosHerramientas de análisis multidimensional y un nuevo sistema de arquitectura de empresas son útilesLas herramientas OLAP también son útiles

Page 35: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …nbaloian/DSS-DCC/Esp/2_2.pdfaccesibles para operaciones QTransforma datos de operación a formas relacionadas QSolo los datos requeridos

35

Resumen

Nuevos formatos de datos para el DBMSInternet y intranet interfases vía web para acceso al DBMSMétodos de inteligencia artificial incorporados al DBMS