Base de Datos
-
Upload
ana-salcedo -
Category
Documents
-
view
3 -
download
0
description
Transcript of Base de Datos
-
UNIVERSIDAD YACAMB VICERRECTORADO DE INVESTIGACIN Y POSTGRADO
INSTITUTO DE INVESTIGACIN Y POSTGRADO
BASES DE DATOS TIPOS Y CARACTERISTICAS
Autor: Ana Salcedo
Barquisimeto, Julio 2015
-
2
ENSAYO CRITICO SOBRE LAS BASES DE DATOS TIPOS Y CARACTERISTICAS
Durante las dcadas de los 60 y 70 surge el concepto de las bases de
datos; sin embargo, el objetivo principal siempre ha sido la administracin
ptima de la informacin y el uso que se le puede dar a la misma. Hoy, las
necesidades de las empresas han cambiado y la necesidad de interactuar
con diversas fuentes de informacin ha desafiado a las bases de datos. Lo
anterior ha provocado que los volmenes de informacin sean mayores, su
formato muy diverso lo que incrementa as los tiempos de respuesta para
analizar la informacin y tomar decisiones.
Existe mucha informacin acerca de las bases de datos, por lo tanto el
objetivo de este artculo no es hacerlo un experto en el tema sino solo ser una gua
de los conceptos que se manejan actualmente, conocer brevemente las
caractersticas de las bases de datos y las soluciones que existen hoy en da.
Qu es una base de datos?
De una manera simple, es un contenedor que permite almacenar la
informacin de forma ordenada con diferentes propsitos y usos. Por
ejemplo, en una base de datos se puede almacenar informacin de
diferentes departamentos (Ventas, Recursos Humanos, Inventarios, entre
otros). El almacenamiento de la informacin por s sola no tiene un valor,
pero si combinamos o relacionamos la informacin con diferentes
departamentos nos puede dar valor. Por ejemplo, combinar la informacin de
las ventas del mes de junio del 2014 para el producto X en la zona norte nos
da un indicativo del comportamiento de las ventas en un periodo de tiempo.
Tipos de bases de datos
Existen muchas empresas con diferentes giros y dependiendo del giro
ser el tipo de procesamiento que se le dar a la informacin, esto
determinar el tipo de base de datos a utilizar. Existen diferentes tipos de
bases de datos pero las ms comunes son las OLTP y OLAP.
-
3
Las bases de datos de tipo OLTP (On Line Transaction Processing)
tambin son llamadas bases de datos dinmicas lo que significa que la
informacin se modifica en tiempo real, es decir, se insertan, se eliminan, se
modifican y se consultan datos en lnea durante la operacin del sistema. Un
ejemplo es el sistema de un supermercado donde se van registrando cada
uno de los artculos que el cliente est comprando y a su vez el sistema va
actualizando el Inventario.
Las bases de datos de tipo OLAP (On Line Analytical Processing)
tambin son llamadas bases de datos estticas lo que significa que la
informacin en tiempo real no es afectada, es decir, no se insertan, no se
eliminan y tampoco se modifican datos; solo se realizan consultas sobre los
datos ya existentes para el anlisis y toma de decisiones. Este tipo de bases
de datos son implementadas en Business Intelligence para mejorar el
desempeo de las consultas con grandes volmenes de informacin.
La necesidad de implementar un tipo u otro depender del giro y
necesidades de cada empresa. Es muy importante identificar el tipo de base
de datos que se requiere antes de implementar un manejador de base de
datos. Por ejemplo podemos citar al manejador de base de datos DB2 10.5
with BLU Acceleration, la cual proporciona una solucin para la parte
transaccional y para la parte de analticos.
Tipo de informacin que se puede almacenar
Cuando surgen las bases de datos el tipo de informacin que se poda
almacenar era de tipo estructurada. La informacin es almacenada en un
objeto llamado Tabla la cual nos permite organizar la informacin. Por
ejemplo, la tabla de Empleados contiene informacin relacionada al
#Empleado, Nombre, Apellido, #Seguro Social, etc. Cada uno de estos
elementos en una base de datos recibe el nombre de Campo y el conjunto
de estos elementos recibe el nombre de Registro (Tambin llamado
Columna y Rengln, Hilera o Fila).
-
4
Los tipos de datos que se pueden almacenar son diversos, pero los
ms comunes son de tipo Numrico, Decimales y tipo Texto. Conforme han
evolucionado las bases de datos se han expandido los tipos de datos que
pueden almacenar. Por mencionar algunos tipos estn los CLOB (Character
Large Object) y BLOB (Binary Large Object). Los CLOB son utilizados para
almacenar documentos y los BLOB para almacenar una imagen o video.
Otro tipo de dato relevante hoy en da es el tipo de dato XML. Este es
un tipo de dato jerrquico porque parte de un nodo inicial o raz, y a su vez
puede tener n niveles y subniveles. Muchos manejadores de bases de datos
puede manipular este tipo de dato; sin embargo, no de forma nativa como lo
hace DB2, es decir, el documento es almacenado como un CLOB. La
desventaja de almacenarlo como un CLOB implica dividir el documento y
guardarlo en diferentes reas (como si fuera un rompecabezas), y para
consultarlo se debe armar para mostrar su informacin (lo cual implica
problemas de desempeo).
Una ventaja competitiva que tiene DB2 es que los documentos XML
se almacenan de forma nativa, es decir, el documento se almacena dentro
de la base de datos, lo que permite consultar la informacin de forma directa
y con mucho mejor desempeo. Incluso se pueden crear ndices a nivel
documento XML para consultar un nodo en especfico, y as acceder ms
rpido a la informacin. Otra ventaja es la compresin de documento XML lo
cual incrementa el ahorro en almacenamiento.
Existen otras bases de datos que permiten almacenar diferentes tipos
de documento, como por ejemplo: Cloudant, el cual se ver ms adelante.
Con la evolucin en las tecnologas de la informacin y las nuevas
necesidades en el manejo de la informacin nace el concepto Big Data.
Existen diferentes definiciones, pero la ms sencilla es el manejo de grandes
volmenes de informacin que vienen de diferentes fuentes de datos
(Estructurados, No estructurados, XML, HTML, etc.) de una manera rpida
sin afectar la disponibilidad de la informacin y operacin de los sistemas.
-
5
Las consultas hechas en Big Data ayudan al anlisis y a la toma de
decisiones.
Otra de las ventajas competitivas que tiene las bases de datos como
DB2 e Informix es que permite hacer la explotacin de la informacin que
viene de diferentes fuentes permitiendo as la integracin con otros sistemas
y lenguajes que utilizan sentencias SQL y NoSQL.
Informacin a travs del tiempo
Cuando se crea una base de datos y se inicia su operacin el volumen
de la informacin es mnima y el desempeo de la aplicacin y base de datos
es ptima. Sin embargo conforme pasa el tiempo el volumen de informacin
incrementa y en consecuencia surgen los siguientes problemas:
Problemas de espacio en disco.
Incrementos de costo en almacenamiento y procesamiento.
Problemas de desempeo en las consultas.
Fallas en el aplicativo afectando la disponibilidad de los datos.
Problemas con la base de datos y la prdida de informacin.
De los problemas anteriores surge la necesidad de hacer mejoras a
las bases de datos y/o crear arquitecturas para dar soluciones a los
problemas anteriores. Se han implementado varias soluciones a nivel
Software y Hardware.
Uno de los principales problemas a solucionar es la disponibilidad y la
prdida de la informacin. En DB2 existen dos soluciones, la primera evita
perder la informacin en caso de desastres, contingencia, etc. y la segunda
evita que la disponibilidad de la informacin se vea afectada, es decir, la
informacin estar disponible 24x7 (En todo momento). Estas soluciones
son:
HADR (High Availability and Disaster Recovery) Alta
disponibilidad.
-
6
PureScale Disponibilidad continua.
Conclusin
El tema de bases de datos es muy amplio de explorar y difcil de
seleccionar cul es la mejor arquitectura a utilizar. Normalmente se separan
las bases de datos para operaciones Transaccionales y para Analticos. Es
necesario hacer un buen anlisis del tipo de operacin que se va a ejecutar
en la base de datos para poder elegir la arquitectura ms adecuada y as
realizar un buen uso de las capacidades de las bases de datos para obtener
los mejores resultados. Para las compaas es difcil mantener un equilibrio
entre invertir en Hardware y Software. Ya hemos visto diferentes tipos de
soluciones que se adaptan a los distintos giros de empresas. La compresin
de datos, el manejo de grandes volmenes de informacin (Estructurados y
No Estructurados), datos en memoria, lenguajes de programacin que
utilizan sentencias SQL y NoSQL, sistemas hbridos (Transaccionales y
Analticos), reduccin de costos de almacenamiento y los tiempos mnimos
de respuesta para obtener un resultado han sido los motivos para el
desarrollo de nuevas arquitecturas a nivel Software y Hardware.