Download - Sfd 2013 pentaho

Transcript
Page 1: Sfd 2013 pentaho

DB OPEN SOURCE Y PENTAHO

Rolando Herrera Matos

[email protected]@rollyherrera

Page 2: Sfd 2013 pentaho

QUE ES UN SGDB ?

Page 3: Sfd 2013 pentaho

Un Sistema de Gestión de Bases de Datos (SGBD) es un conjunto de programas que permiten el almacenamiento, modificación y extracción de la información en una base de datos, además de proporcionar herramientas para añadir, borrar, modificar y analizar los datos.

Page 4: Sfd 2013 pentaho

Componentes SGDB

Page 5: Sfd 2013 pentaho

¿LIBRE O PRIVATIVO?

Page 6: Sfd 2013 pentaho

LIBRE

Page 7: Sfd 2013 pentaho
Page 8: Sfd 2013 pentaho

PRINCIPALES BASE DE DATOS LIBRES

MYSQL: (GPL)

http://www.mysql.com/

Page 9: Sfd 2013 pentaho

PRINCIPALES BASE DE DATOS LIBRES

POSTREGRESQL: (BSD)

http://www.postgresql.org/

Page 10: Sfd 2013 pentaho

MongoDB : Es una base de datos Open Source de gran rendimiento, escalable, schema-free (NOSQL) y orientada a documentos (esquemas de datos tipo JSON). Hay drivers preparados para usar esta base de datos desde lenguajes como PHP, Python, Perl, Ruby, JavaScript, C++ y muchos más.

http://www.mongodb.org/

Page 11: Sfd 2013 pentaho

HyperTable (GPL) : Es un sistema de almacenamiento distribuido de datos de alto rendimiento diseñado para soportar aplicaciones que requieran máximo rendimiento, escalabilidad y eficiencia. Se ha diseñado y modelado a partir del proyecto BigTable de Google y se enfoca sobre todo a conjuntos de datos de gran escala.

http://hypertable.org/

Page 12: Sfd 2013 pentaho

APACHE COUCH DB (Apache License, Version 2.0) : Este proyecto está destinado a ofrecer una base de datos orientada a documentos que se pueden consultar o indexar en modo MapReduce usando JavaScript. CouchDB ofrece una API JSON RESTful a la que se puede acceder desde cualquier entorno que soporte peticiones HTTP.

http://couchdb.apache.org/

Page 13: Sfd 2013 pentaho

NEO4J (GPL) : Es un motor de persistencia completamente transaccional en Java que almacena los datos mediante grafos, y no mediante tablas. Neo4j ofrece una escalabilidad masiva. Puede manejar grafos de varios miles de millones de nodos/relaciones/propiedades en una única máquina, y se puede escalar a lo largo de múltiples máquinas.

http://www.neo4j.org/

Page 14: Sfd 2013 pentaho

RIAK (Apache License, Version 2.0) : Riak es una base de datos ideal para aplicaciones web y combina:

Un manejo de key descentralizado Un motor map/reduce flexible Una interfaz de consultas HTTP/JSON amigable.

http://docs.basho.com/riak/latest//

Page 15: Sfd 2013 pentaho

ORACLE BERKELY DB (Open Source OSI) :Bases de datos embebidas que proporciona a los desarrolladores persistencia local, rápida y eficiente con una administración nula. Oracle Berkeley DB se enlaza a nuestras aplicaciones y permite realizar llamadas simples a funciones en lugar de enviar mensajes a un servidor remoto para mejorar el rendimiento..

http://www.oracle.com/technetwork/products/berkeleydb/overview/index.html/

Page 16: Sfd 2013 pentaho

Apache CASSANDRA (Apache License, Version 2.0) :Cassandra es probablemente uno de los proyectos NoSQL más concoidos del mercado. Se trata de una base de datos distribuida de segunda generación con alta escalabilidad que está siendo usada por gigantes como Facebook (que es quien la ha desarrollado), Digg, Twitter, Cisco y más empresas.

http://cassandra.apache.org/

Page 17: Sfd 2013 pentaho

MenCached (GPL) :es un almacen del tipo in-memory key-value para pequeñas cadenas de datos arbitrarios (textos, objetos) de resultados de llamadas a base de datos, llamadas a API, o renderizado de páginas. Está orientado a acelerar aplicaciones web dinámicas al aliviar la carga de la base de datos.

http://memcached.org/

Page 18: Sfd 2013 pentaho

FIREBIRD (MPL) :Firebird es una base de datos relacional que puede ser utilizada en Linux, Windows y varias plataformas UNIX, y ofrece un alto rendimiento y potente soporte de lenguajes para procedimientos almacenados y triggers.

http://www.firebirdsql.org/

Page 19: Sfd 2013 pentaho

MariaDB (GPL) MariaDB es una rama compatible hacia atrás de MySQL® Database Server. Incluye soporte para la mayoría de los motores de almacenamiento Open Source, y además para el propio motor de almacenamiento Maria.

https://mariadb.com/

Page 20: Sfd 2013 pentaho

Drizzle (BSD-GPL): Es un fork de MySQL que se centra en ser una base de datos eficiente y estable, sobre todo optimizada para aplicaciones de Internet y que siguen la filosofía Cloud Computing.

https://launchpad.net/drizzle

Page 21: Sfd 2013 pentaho

hyperSql (BSD): Es un motor de bases de datos relacionales SQL escrito en Java. HyperSQL ofrece un pequeño pero veloz motor de bases de datos que dispone de tablas in-memory y basadas en disco, y que soporta los modos embebido y servidor. Además, dispone de herramientas como una consola de comandos SQL y una interfaz gráfica para las consultas.

http://hsqldb.org/

Page 22: Sfd 2013 pentaho

MonetDB (BSD): MonetDB es un sistema de bases de datos para aplicaciones de alto rendimiento dirigidas a la minería de datos, OAP, GIS, búsquedas XML, y recolección de información a partir de ficheros de texto y multimedia.

http://www.monetdb.org/Legal/MonetDBLicense

Page 23: Sfd 2013 pentaho

BUSSINES INTELLIGENCE CON PENTAHO

Page 24: Sfd 2013 pentaho

BUSSINES INTELLIGENCE

Conjunto de estrategias y herramientas enfocadas a la administración y creación de conocimiento mediante el análisis de datos existentes en una organización o empresa.

Page 25: Sfd 2013 pentaho

PROCESOS BUSSINES INTELLIGENCE

Page 26: Sfd 2013 pentaho

PENTAHO• Es la unión de varios proyectos libres relacionados con BI• Reportes, dashboards, procesos ETL, cubos, data mining• Proporciona una plataforma Web • Basado en Java J2EE• Servidor Web Jboss o Tomcat• Sorporta MS-SQL, Oracle, PostqreSQL, MySQL• Windows XP, Windows 2003, Linux• Versión libre y versión Enterprise

Page 27: Sfd 2013 pentaho

PROCESOS BUSSINES INTELLIGENCE

Page 28: Sfd 2013 pentaho

PENTAHOEs la unión de varios proyectos libres relacionados con BIReportes, dashboards, procesos ETL, cubos, data miningProporciona una plataforma Web Basado en Java J2EEServidor Web Jboss o TomcatSorporta MS-SQL, Oracle, PostqreSQL, MySQLWindows XP, Windows 2003, LinuxVersión libre y versión Enterprise

Page 29: Sfd 2013 pentaho

PENTAHOPentaho cuenta con:Jfree Report: Motor para reportesMondrian: Motor para cubosWeka: Motor para minería de datosPlataforma Web para publicar y visualizar la información

Pentaho cuenta con herramientas “separadas” para llevar a cabo las siguientes funciones:Para generar reportes: Report DesignerPara generar cubos: Cube designer, WorkBench.Para minería de datos: WekaPara generar procesos ETL: Kettle (Spoon/Pan)

Page 30: Sfd 2013 pentaho

PENTAHO

KETTLE (SPOON)

JFREE REPORT

MONDRIAN

WEKA

PLATAFORMA WEB

SISTEMAS OLAP

MS-SQL

ORACLE

MYSQL

EXCEL

Page 31: Sfd 2013 pentaho

PENTAHOPentaho cuenta con:Jfree Report: Motor para reportesMondrian: Motor para cubosWeka: Motor para minería de datosPlataforma Web para publicar y visualizar la información

Pentaho cuenta con herramientas “separadas” para llevar a cabo las siguientes funciones:Para generar reportes: Report DesignerPara generar cubos: Cube designer, WorkBench.Para minería de datos: WekaPara generar procesos ETL: Kettle (Spoon/Pan)

Page 32: Sfd 2013 pentaho

PENTAHO

Page 33: Sfd 2013 pentaho

PENTAHO

Page 34: Sfd 2013 pentaho

PENTAHO

Page 35: Sfd 2013 pentaho

PENTAHO

Page 36: Sfd 2013 pentaho

PENTAHO

Page 37: Sfd 2013 pentaho

PENTAHO

Page 38: Sfd 2013 pentaho

PENTAHO

Page 40: Sfd 2013 pentaho

¿PREGUNTAS ?

GRACIAS

[email protected]@bladecode.com

@rollyherrera