Sfd 2013 pentaho

download Sfd 2013 pentaho

of 40

  • date post

    05-Dec-2014
  • Category

    Documents

  • view

    965
  • download

    0

Embed Size (px)

description

 

Transcript of Sfd 2013 pentaho

  • 1. DB OPEN SOURCE Y PENTAHO Rolando Herrera Matos rolando.herrera@apesol.org.pe @rollyherrera
  • 2. QUE ES UN SGDB ?
  • 3. Un Sistema de Gestin de Bases de Datos (SGBD) es un conjunto de programas que permiten el almacenamiento, modificacin y extraccin de la informacin en una base de datos, adems de proporcionar herramientas para aadir, borrar, modificar y analizar los datos.
  • 4. Componentes SGDB
  • 5. LIBRE O PRIVATIVO?
  • 6. LIBRE
  • 7. PRINCIPALES BASE DE DATOS LIBRES MYSQL: (GPL) http://www.mysql.com/
  • 8. PRINCIPALES BASE DE DATOS LIBRES POSTREGRESQL: (BSD) http://www.postgresql.org/
  • 9. MongoDB : Es una base de datos Open Source de gran rendimiento, escalable, schema-free (NOSQL) y orientada a documentos (esquemas de datos tipo JSON). Hay drivers preparados para usar esta base de datos desde lenguajes como PHP, Python, Perl, Ruby, JavaScript, C++ y muchos ms. http://www.mongodb.org/
  • 10. HyperTable (GPL) : Es un sistema de almacenamiento distribuido de datos de alto rendimiento diseado para soportar aplicaciones que requieran mximo rendimiento, escalabilidad y eficiencia. Se ha diseado y modelado a partir del proyecto BigTable de Google y se enfoca sobre todo a conjuntos de datos de gran escala. http://hypertable.org/
  • 11. APACHE COUCH DB (Apache License, Version 2.0) : Este proyecto est destinado a ofrecer una base de datos orientada a documentos que se pueden consultar o indexar en modo MapReduce usando JavaScript. CouchDB ofrece una API JSON RESTful a la que se puede acceder desde cualquier entorno que soporte peticiones HTTP. http://couchdb.apache.org/
  • 12. NEO4J (GPL) : Es un motor de persistencia completamente transaccional en Java que almacena los datos mediante grafos, y no mediante tablas. Neo4j ofrece una escalabilidad masiva. Puede manejar grafos de varios miles de millones de nodos/relaciones/propiedades en una nica mquina, y se puede escalar a lo largo de mltiples mquinas. http://www.neo4j.org/
  • 13. RIAK (Apache License, Version 2.0) : Riak es una base de datos ideal para aplicaciones web y combina: Un manejo de key descentralizado Un motor map/reduce flexible Una interfaz de consultas HTTP/JSON amigable. http://docs.basho.com/riak/latest//
  • 14. ORACLE BERKELY DB (Open Source OSI) :Bases de datos embebidas que proporciona a los desarrolladores persistencia local, rpida y eficiente con una administracin nula. Oracle Berkeley DB se enlaza a nuestras aplicaciones y permite realizar llamadas simples a funciones en lugar de enviar mensajes a un servidor remoto para mejorar el rendimiento.. http://www.oracle.com/technetwork/products/berkeleydb/overview/index.html/
  • 15. Apache CASSANDRA (Apache License, Version 2.0) :Cassandra es probablemente uno de los proyectos NoSQL ms concoidos del mercado. Se trata de una base de datos distribuida de segunda generacin con alta escalabilidad que est siendo usada por gigantes como Facebook (que es quien la ha desarrollado), Digg, Twitter, Cisco y ms empresas. http://cassandra.apache.org/
  • 16. MenCached (GPL) :es un almacen del tipo in-memory key-value para pequeas cadenas de datos arbitrarios (textos, objetos) de resultados de llamadas a base de datos, llamadas a API, o renderizado de pginas. Est orientado a acelerar aplicaciones web dinmicas al aliviar la carga de la base de datos. http://memcached.org/
  • 17. FIREBIRD (MPL) :Firebird es una base de datos relacional que puede ser utilizada en Linux, Windows y varias plataformas UNIX, y ofrece un alto rendimiento y potente soporte de lenguajes para procedimientos almacenados y triggers. http://www.firebirdsql.org/
  • 18. MariaDB (GPL) MariaDB es una rama compatible hacia atrs de MySQL Database Server. Incluye soporte para la mayora de los motores de almacenamiento Open Source, y adems para el propio motor de almacenamiento Maria. https://mariadb.com/
  • 19. Drizzle (BSD-GPL): Es un fork de MySQL que se centra en ser una base de datos eficiente y estable, sobre todo optimizada para aplicaciones de Internet y que siguen la filosofa Cloud Computing. https://launchpad.net/drizzle
  • 20. hyperSql (BSD): Es un motor de bases de datos relacionales SQL escrito en Java. HyperSQL ofrece un pequeo pero veloz motor de bases de datos que dispone de tablas in-memory y basadas en disco, y que soporta los modos embebido y servidor. Adems, dispone de herramientas como una consola de comandos SQL y una interfaz grfica para las consultas. http://hsqldb.org/
  • 21. MonetDB (BSD): MonetDB es un sistema de bases de datos para aplicaciones de alto rendimiento dirigidas a la minera de datos, OAP, GIS, bsquedas XML, y recoleccin de informacin a partir de ficheros de texto y multimedia. http://www.monetdb.org/Legal/MonetDBLicense
  • 22. BUSSINES INTELLIGENCE CON PENTAHO
  • 23. BUSSINES INTELLIGENCE Conjunto de estrategias y herramientas enfocadas a la administracin y creacin de conocimiento mediante el anlisis de datos existentes en una organizacin o empresa.
  • 24. PROCESOS BUSSINES INTELLIGENCE
  • 25. PENTAHO Es la unin de varios proyectos libres relacionados con BI Reportes, dashboards, procesos ETL, cubos, data mining Proporciona una plataforma Web Basado en Java J2EE Servidor Web Jboss o Tomcat Sorporta MS-SQL, Oracle, PostqreSQL, MySQL Windows XP, Windows 2003, Linux Versin libre y versin Enterprise
  • 26. PROCESOS BUSSINES INTELLIGENCE
  • 27. PENTAHO Es la unin de varios proyectos libres relacionados con BI Reportes, dashboards, procesos ETL, cubos, data mining Proporciona una plataforma Web Basado en Java J2EE Servidor Web Jboss o Tomcat Sorporta MS-SQL, Oracle, PostqreSQL, MySQL Windows XP, Windows 2003, Linux Versin libre y versin Enterprise
  • 28. PENTAHO Pentaho cuenta con: Jfree Report: Motor para reportes Mondrian: Motor para cubos Weka: Motor para minera de datos Plataforma Web para publicar y visualizar la informacin Pentaho cuenta con herramientas separadas para llevar a cabo las siguientes funciones: Para generar reportes: Report Designer Para ge