Modulo Instalacion Pentaho

63
Business Business Intelligence Intelligence

Transcript of Modulo Instalacion Pentaho

Page 1: Modulo Instalacion Pentaho

BusinessBusiness IntelligenceIntelligence

Page 2: Modulo Instalacion Pentaho

● Pentaho BI Server (Pentaho Administration Console)

● Pentaho Data Integration (Kettle)● Pentaho Report Designer● Pentaho Design Studio● Mondrian Schema Workbench● Weka Data Mining● Pentaho Dashboard Editor

Page 3: Modulo Instalacion Pentaho

Pentaho CommunityPentaho Community ● En el año 2001 el belga Matt Casters comenzó el desarrollo

de Kettle como una herramienta de uso personal para la integración de sistemas. Hizo el desarrollo en Java y su biblioteca gráfica AWT.

● En el 2004 se publica en Javaforge como Open Source su versión 1.2

● La versión 2.0 incluye un sistema de plugins para permitir el desarrrollo de conectores de Kettle con otros sistemas (como SAP).

● En el año 2005 se libera el código y crece rápidamente con una comunidad muy activa.

● Casters vende Kettle a Pentaho en el año 2006 para ser incluído como su herramienta ETL de su suite de productos. Pero sigue trabajando en el proyecto como parte del equipo de desarrollo de su arquitectura en esa compañía.

Page 4: Modulo Instalacion Pentaho

Pentaho Pentaho CommunityCommunity ● El nombre de Kettle viene de KDE Extraction, Transportation,

Transformation and Loading Environment, pues originariamente la herramienta iba a ser escrita para KDE, el famoso escritorio de Linux.

● A raíz de la compra por parte de Pentaho, Kettle se renombró como Pentaho Data Integration (PDI).

● Pentaho es un conjunto programas libres que abordan las distintas fases de la BI (Inteligencia de Negocios). La principal diferencia entre la versión comercial y la de paga, es que la primera tiene integradas todas sus funciones, en tanto que la segunda consta de componentes dedicados que deben instalarse y configurarse por separado.

Page 5: Modulo Instalacion Pentaho

Pentaho Pentaho CommunityCommunity

Page 6: Modulo Instalacion Pentaho

Pentaho: PrerrequisitosPentaho: PrerrequisitosWINDOWS: Los prerrequisitos para la instalación de la Suite de Pentaho:

● Java Runtime Environment JRE

Page 7: Modulo Instalacion Pentaho

Pentaho: PrerrequisitosPentaho: Prerrequisitos● Configurar la variable de entorno

JAVA_HOME

● Crear una base de datos en blanco en cualquier motor de base de datos

Page 8: Modulo Instalacion Pentaho

Pentaho: PrerrequisitosPentaho: Prerrequisitos

LINUX:

Los prerrequisitos para la instalación de la Suite de Pentaho:

● Java Runtime Environment JRE

sudo apt-get install openjdk-6-jdk

● Configurar la variable de entorno JAVA_HOME

sudo su root -c "echo 'export JAVA_HOME=\"/usr/lib/jvm/java-1.6.0-openjdk-amd64\"' >> /etc/environment"

● Verificar la instalación del JRE: java -version

Page 9: Modulo Instalacion Pentaho

Pentaho: PrerrequisitosPentaho: Prerrequisitos

LINUX:

Los prerrequisitos para la instalación de la Suite de Pentaho:

● Editar el archivo environment: gedit /etc/environment

export PENTAHO_JAVA_HOME=/usr/lib/jvm/java-7-sun

● Verificar la instalación del JRE: env | grep PENTAHO_JAVA_HOME

● Crear una base de datos en blanco en cualquier motor de base de datos

Page 10: Modulo Instalacion Pentaho

Pentaho BI Server CEPentaho BI Server CE Pentaho Administration Console

(PAC)Permite la administración de los módulos de Pentaho. El PAC simplifica las tareas administrativas como la creación de usuarios, la asignación de roles, la conexión de bases de datos y la gestión de servicios, permite automatizar tareas. Se conecta con el PRD y puede generar reportes de manera periódica.

Pentaho User Console (PUC)

Tiene el CDE (Community Dashboard Editor) el cual facilita las vistas de reportes y análisis. Se conecta con el PAC, el PRD y el Editor de Metadatos directamente.

Page 11: Modulo Instalacion Pentaho

Pentaho BI Server CEPentaho BI Server CE Comunity Dashboard Editor

(CDE)

El CDE es un editor de cuadros de mando a través de una interfaz gráfica web. Es un proyecto independiente que se desarrolla por una empresa portuguesa liderada por Pedro Alves. Sus antecedentes son el CDF (Comunity Dashboard Framework), CDA (Comunity Data Access)y CCC (Comunity Chart Component). Actualmente el CDE forma parte del paquete de instalación de la PUC.Para crear un cuadro de mandos necesitamos definir cuáles indicadores (PKIs) nos interesa mostrar y cómo se desea que se visualicen.

Page 12: Modulo Instalacion Pentaho

Pentaho BI Server CEPentaho BI Server CE Comunity Dashboard Editor

(CDE)Ejemplo: PKI → presupuesto { por departamento por área, por sucursaleficiencia en la entrega de

productos { por distribuidor Rango→ quién se desvía por arriba (gasta más de lo presupuestado, entrega más tarde) quién se desvía por abajo (gasta menos del presupuesto, entrega antes de la fecha límite)

El diseño de un Dashboard en el CDE se hace en 3 capas: Presentación, Componentes y Datos.

Page 13: Modulo Instalacion Pentaho

Pentaho BI Server CEPentaho BI Server CE Comunity Dashboard Editor

(CDE)Presentación: Se pueden usar plantillas o podemos hacer nuestro propio diseño (Debe considerarse que el ancho máximo de la página es 24 porque está basado en el CSS BluePrint)Componentes: Se elige un componente para utilizar

el origen de datos, puede ser una gráfica (chart), un tacómetro, etc.

Datos: Se configura en la pestaña de Data Sources el origen de los datos de todos los disponibles. Puede ser una BD o un cubo OLAP (este último puede estar en formato MDX [multidimensional] generado con Mondrian). La consulta se hace en SQL.

Page 14: Modulo Instalacion Pentaho

Pentaho BI Server CEPentaho BI Server CE Instalación Ubuntu

●Abrir una terminal.●Crear el usuario pentaho con permisos de administración.

sudo useradd -s /bin/bash -m pentahosudo passwd pentaho

●Conectarse como el usuario pentaho: su pentaho -●Descargar el BI Server CE

wgethttp://heanet.dl.sourceforge.net/project/pentaho/Business%20Intelligence%20Server/5.0.1-stable/biserver-ce-5.0.1-stable.zip

●Descomprimir el BI Server CE: sudo unzip biserver-ce-5.0.1-stable.zip -d /opt/pentaho

Page 15: Modulo Instalacion Pentaho

Pentaho BI Server CEPentaho BI Server CE Instalación Ubuntu

●Configurar el repositorio. Pentaho admite la configuración en PostgreSQL,

MySQL y Oracle.La configuración predeterminada es en PostgreSQL.El repositorio consta de tres bases:● Jackrabbit (JCR) que contiene ejemplos de

soluciones, seguridad de datos y datos para crear reportes.

● Quartz contiene datos para la planificación de jobs y reportes.

● Hibernate contiene datos para auditar.● Desde una terminal conectarse como el usuario postgres: psql -U postgres -h localhost

Page 16: Modulo Instalacion Pentaho

Pentaho BI Server CEPentaho BI Server CE

Instalación UbuntuEjecutar los scripts de creación de los repositorios.● sudo -u postgres psql -a -f /opt/pentaho/biserver-

ce/data/postgresql/create_quartz_postgresql.sql● sudo -u postgres psql -a -f /opt/pentaho/biserver-

ce/data/postgresql/create_repository_postgresql.sql

● sudo -u postgres psql -a -f /opt/pentaho/biserver-ce/data/postgresql/create_jcr_postgresql.sql

●Si se desea, se pueden editar los archivos para modificar el password.● En caso necesario se edita el archivo pg_hba.conf para cambiar el tipo de validación.

Page 17: Modulo Instalacion Pentaho

Pentaho BI Server CEPentaho BI Server CE Instalación Ubuntu Server

Cambiar el archivo pentaho tomcat context.xml:(/opt/pentaho/biserver-ce/tomcat/webapps/pentaho/META-INF/context.xml)

sudo sed -i s/"org.hsqldb.jdbcDriver"/"org.postgresql.Driver"/g /opt/pentaho/biserver-ce/tomcat/webapps/pentaho/META-INF/context.xmlsudo sed -i s/"jdbc:hsqldb:hsql:\/\/localhost\/hibernate"/"jdbc:postgresql\/\/localhost:5432\/hibernate"/g /opt/pentaho/biserver-ce/tomcat/webapps/pentaho/META-INF/context.xmlsudo sed -i s/"select count(\*) from INFORMATION_SCHEMA.SYSTEM_SEQUENCES"/"select 1"/g /opt/pentaho/biserver-ce/tomcat/webapps/pentaho/META-INF/context.xmlsudo sed -i s/"org.hsqldb.jdbcDriver"/"org.postgresql.Driver"/g /opt/pentaho/biserver-ce/tomcat/webapps/pentaho/META-INF/context.xmlsudo sed -i s/"jdbc:hsqldb:hsql:\/\/localhost\/quartz"/"jdbc:postgresql\/\/localhost:5432\/quartz"/g /opt/pentaho/biserver-ce/tomcat/webapps/pentaho/META-INF/context.xmlsudo sed -i s/"select count(\*) from INFORMATION_SCHEMA.SYSTEM_SEQUENCES"/"select 1"/g /opt/pentaho/biserver-ce/tomcat/webapps/pentaho/META-INF/context.xml

Page 18: Modulo Instalacion Pentaho

Pentaho BI Server CEPentaho BI Server CE

Instalación Ubuntu Server

Cambiar el archivo hibernate config: (/opt/pentaho/biserver-ce/pentaho-solutions/system/applicationContext-spring-security-hibernate.properties)

sudo sed -i s/"org.hsqldb.jdbcDriver"/"org.postgresql.Driver"/g /opt/pentaho/biserver-ce/pentaho-solutions/system/applicationContext-spring-security-hibernate.propertiessudo sed -i s/"jdbc:hsqldb:hsql:\/\/localhost\/hibernate"/"jdbc:postgresql\/\/localhost:5432\/hibernate"/g /opt/pentaho/biserver-ce/pentaho-solutions/system/applicationContext-spring-security-hibernate.properties

Page 19: Modulo Instalacion Pentaho

Pentaho BI Server CEPentaho BI Server CE

Instalación Ubuntu Server

Cambiar el archivo hibernate config: (/opt/pentaho/biserver-ce/pentaho-solutions/system/hibernate/hibernate-settings.xml)

sudo sed -i s/"system\/hibernate\/hsql.hibernate.cfg.xml"/"system\/hibernate\/postgresql.hibernate.cfg.xml"/g /opt/pentaho/biserver-ce/pentaho-solutions/system/hibernate/hibernate-settings.xml

Page 20: Modulo Instalacion Pentaho

Pentaho BI Server CEPentaho BI Server CE Instalación Ubuntu Server

Cambiar el archivo hibernate config: (/opt/pentaho/biserver-ce/pentaho-solutions/system/simple-jndi/jdbc.properties)

sudo sed -i s/"SampleData\/type=javax.sql.DataSource"/"#SampleData\/type=javax.sql.DataSource"/g /opt/pentaho/biserver-ce/pentaho-solutions/system/simple-jndi/jdbc.propertiessudo sed -i s/"SampleData\/driver=org.hsqldb.jdbcDriver"/"#SampleData\/driver=org.hsqldb.jdbcDriver"/g /opt/pentaho/biserver-ce/pentaho-solutions/system/simple-jndi/jdbc.propertiessudo sed -i s/"SampleData\/url=jdbc:hsqldb:hsql:\/\/localhost\/sampledata"/"#SampleData\/url=jdbc:hsqldb:hsql:\/\/localhost\/sampledata"/g /opt/pentaho/biserver-ce/pentaho-solutions/system/simple-jndi/jdbc.propertiessudo sed -i s/"SampleData\/user=pentaho_user"/"#SampleData\/user=pentaho_user"/g /opt/pentaho/biserver-ce/pentaho-solutions/system/simple-jndi/jdbc.properties

Page 21: Modulo Instalacion Pentaho

Pentaho BI Server CEPentaho BI Server CE Instalación Ubuntu Server

sudo sed -i s/"SampleData\/password=password"/"#SampleData\/password=password"/g /opt/pentaho/biserver-ce/pentaho-solutions/system/simple-jndi/jdbc.propertiessudo sed -i s/"Hibernate\/driver=org.hsqldb.jdbcDriver"/"Hibernate\/driver=org.postgresql.Driver"/g /opt/pentaho/biserver-ce/pentaho-solutions/system/simple-jndi/jdbc.propertiessudo sed -i s/"Hibernate\/url=jdbc:hsqldb:hsql:\/\/localhost\/hibernate"/"Hibernate\/url=jdbc:postgresql:\/\/localhost:5432\/hibernate"/g /opt/pentaho/biserver-ce/pentaho-solutions/system/simple-jndi/jdbc.propertiessudo sed -i s/"Quartz\/driver=org.hsqldb.jdbcDriver"/"Quartz\/driver=org.postgresql.Driver"/g /opt/pentaho/biserver-ce/pentaho-solutions/system/simple-jndi/jdbc.propertiessudo sed -i s/"Quartz\/url=jdbc:hsqldb:hsql:\/\/localhost\/quartz"/"Quartz\/url=jdbc:postgresql:\/\/localhost:5432\/quartz"/g /opt/pentaho/biserver-ce/pentaho-solutions/system/simple-jndi/jdbc.propertiessudo sed -i s/"Shark\/type=javax.sql.DataSource"/"#Shark\/type=javax.sql.DataSource"/g /opt/pentaho/biserver-ce/pentaho-solutions/system/simple-jndi/jdbc.properties

Page 22: Modulo Instalacion Pentaho

Pentaho BI Server CEPentaho BI Server CE Instalación Ubuntu Server

sudo sed -i s/"Shark\/driver=org.hsqldb.jdbcDriver"/"#Shark\/driver=org.hsqldb.jdbcDriver"/g /opt/pentaho/biserver-ce/pentaho-solutions/system/simple-jndi/jdbc.propertiessudo sed -i s/"Shark\/url=jdbc:hsqldb:hsql:\/\/localhost\/shark"/"#Shark\/url=jdbc:hsqldb:hsql:\/\/localhost\/shark"/g /opt/pentaho/biserver-ce/pentaho-solutions/system/simple-jndi/jdbc.propertiessudo sed -i s/"Shark\/user=sa"/"#Shark\/user=sa"/g /opt/pentaho/biserver-ce/pentaho-solutions/system/simple-jndi/jdbc.propertiessudo sed -i s/"Shark\/password="/"#Shark\/password="/g /opt/pentaho/biserver-ce/pentaho-solutions/system/simple-jndi/jdbc.propertiessudo sed -i s/"SampleDataAdmin\/type=javax.sql.DataSource"/"#SampleDataAdmin\/type=javax.sql.DataSource"/g /opt/pentaho/biserver-ce/pentaho-solutions/system/simple-jndi/jdbc.propertiessudo sed -i s/"SampleDataAdmin\/driver=org.hsqldb.jdbcDriver"/"#SampleDataAdmin\/driver=org.hsqldb.jdbcDriver"/g /opt/pentaho/biserver-ce/pentaho-solutions/system/simple-jndi/jdbc.propertiessudo sed -i s/"SampleDataAdmin\/url=jdbc:hsqldb:hsql:\/\/localhost\/sampledata"/"#SampleDataAdmin\/url=jdbc:hsqldb:hsql:\/\/localhost\/sampledata"/g /opt/pentaho/biserver-ce/pentaho-solutions/system/simple-jndi/jdbc.properties

Page 23: Modulo Instalacion Pentaho

Pentaho BI Server CEPentaho BI Server CE

Instalación Ubuntu Server

sudo sed -i s/"SampleDataAdmin\/user=pentaho_admin"/"#SampleDataAdmin\/user=pentaho_admin"/g /opt/pentaho/biserver-ce/pentaho-solutions/system/simple-jndi/jdbc.propertiessudo sed -i s/"SampleDataAdmin\/password=password"/"#SampleDataAdmin\/password=password"/g /opt/pentaho/biserver-ce/pentaho-solutions/system/simple-jndi/jdbc.properties

●Descargar el driver PostgreSQL JDBC cd /usr/share/java sudo wget jdbc.postgresql.org/download/ postgresql-9.3-1101.jdbc4.jar

Page 24: Modulo Instalacion Pentaho

Pentaho BI Server CEPentaho BI Server CE Instalación Ubuntu

●Asignar permisos de ejecución: sudo chmod +x /opt/pentaho/biserver-ce/*.sh

●Iniciar el servicio:cd /opt/pentaho/biserver-cesudo ./start-pentaho.sh

●Abrir en el navegador: http://localhost:8080/pentaho/Utilizar para autenticarse el usuario: admin y el

password: password.●Para instalar otras aplicaciones de la suite es necesario detener el servicio:

cd /opt/pentaho/biserver-cesudo ./stop-pentaho.sh

Page 25: Modulo Instalacion Pentaho

Pentaho BI Server CEPentaho BI Server CEPentaho Administration Console

Page 26: Modulo Instalacion Pentaho

Pentaho BI Server CEPentaho BI Server CEPentaho Administration Console

Page 27: Modulo Instalacion Pentaho

Pentaho BI Server CEPentaho BI Server CEPentaho Administration Console

Page 28: Modulo Instalacion Pentaho

Pentaho BI Server CEPentaho BI Server CEPentaho Administration Console

Page 29: Modulo Instalacion Pentaho

Pentaho BI Server CEPentaho BI Server CEPentaho Administration Console

Page 30: Modulo Instalacion Pentaho

Pentaho BI Server CEPentaho BI Server CEPentaho Administration Console

Page 31: Modulo Instalacion Pentaho

Pentaho BI Server CEPentaho BI Server CEPentaho Administration Console

Page 32: Modulo Instalacion Pentaho

Pentaho BI Server CEPentaho BI Server CEPentaho Administration Console

Page 33: Modulo Instalacion Pentaho

Pentaho BI Server CEPentaho BI Server CEPentaho Administration Console

Page 34: Modulo Instalacion Pentaho

Pentaho BI Server CEPentaho BI Server CEPentaho Administration Console

Page 35: Modulo Instalacion Pentaho

Pentaho BI Server CEPentaho BI Server CEPentaho Administration Console

Page 36: Modulo Instalacion Pentaho

Pentaho Data IntegrationPentaho Data Integration

Pentaho Data Integración se encarga del procesamiento ETL y a su vez está integrado por:

● Spoon (antes Kettle) es la interfaz gráfica de ETL que permite diseñar transformaciones y trabajos que serán ejecutados por las herramientas del PDI.

● Pan es un motor de transformación de datos que ejecuta las funciones de lectura, manipulación y escritura, es decir las transformaciones de datos, desde varias fuentes.

Page 37: Modulo Instalacion Pentaho

Pentaho Data IntegrationPentaho Data Integration

● Kitchen es el programa encargado de ejecutar los trabajos (jobs) diseñados en spoon con extensión XML o desde un repositorio. Se utiliza para ejecutar los jobs programados por lotes para que sean ejecutados en intervalos regulares de tiempo. Se ejecuta desde el sistema operativo.

● Carte esta herramienta permite ejecutar

transformaciones y jobs de manera remota.

Page 38: Modulo Instalacion Pentaho

Pentaho Data IntegrationPentaho Data Integration

● Kitchen es el programa encargado de ejecutar los trabajos (jobs) diseñados en spoon con extensión XML o desde un repositorio. Se utiliza para ejecutar los jobs programados por lotes para que sean ejecutados en intervalos regulares de tiempo. Se ejecuta desde el sistema operativo.

● Carte esta herramienta permite ejecutar

transformaciones y jobs de manera remota.

Page 39: Modulo Instalacion Pentaho

Instalación: Pentaho Data Instalación: Pentaho Data IntegrationIntegration

Page 40: Modulo Instalacion Pentaho

Instalación: Pentaho Data Instalación: Pentaho Data IntegrationIntegration

Descarga del software

Page 41: Modulo Instalacion Pentaho

Instalación: Pentaho Data Instalación: Pentaho Data Integration (Windows)Integration (Windows)

Page 42: Modulo Instalacion Pentaho

Instalación: Pentaho Data Instalación: Pentaho Data Integration (Windows)Integration (Windows)

Para ingresar a Spoon debe darse doble click sobre el archivo “spoon.bat” ya sea desde la carpeta “\data-integration” o en un acceso directo desde el escritorio.

● Configuración del repositorio

Page 43: Modulo Instalacion Pentaho

Instalación: Pentaho Data Instalación: Pentaho Data Integration (Ubuntu)Integration (Ubuntu)

Obtener el PDI de la página http://sourceforge.net/projects/pentaho/files/Data%20Integration/5.0.1-stable/

● Descomprimir la descarga en la carpeta pentaho/data-integration

sudo unzip pdi-ce-5.0.1.A-stable.zip -d /opt/pentaho

● Dar permisos de ejecución sudo chmod +x *.sh

● Arrancar la herramienta spoon desde una terminal:

cd /opt/pentaho/data-integration/

./spoon.sh

Page 44: Modulo Instalacion Pentaho

Instalación: Pentaho Data Instalación: Pentaho Data Integration (Ubuntu)Integration (Ubuntu)

● Usuario: admin Password: password

Page 45: Modulo Instalacion Pentaho

Instalación: Pentaho Data Instalación: Pentaho Data Integration (Ubuntu)Integration (Ubuntu)

● Seleccionar el tipo de repositorio, en BD o archivo.

● Para un repositorio en BD.

Page 46: Modulo Instalacion Pentaho

Instalación: Pentaho Data Instalación: Pentaho Data Integration (Ubuntu)Integration (Ubuntu)

Page 47: Modulo Instalacion Pentaho

Mondrian Schema Workbench Mondrian Schema Workbench

Es la herramienta para el diseño de cubos, consiste en un JAR (un archivo que permite ejecutar instrucciones escritas en lenguaje Java) que actúa como JDBC (Java Database Connectivity, una API que permite ejecutar operaciones sobre una BD en Java independientemente del SO en SQL nativo) para OLAP (Procesamiento Analítico en Línea, solución de BI para agilizar la consulta de grandes cantidades de datos), proporciona conexiones y ejecuta consultas SQL en una BD relacional. Los cubos se componen de archivos XML y se ejecutan sobre un servidor Web para permitir la comunicación entre aplicaciones OLAP con BDs.

Page 48: Modulo Instalacion Pentaho

Mondrian Schema WorkbenchMondrian Schema Workbench● Instalación

Page 49: Modulo Instalacion Pentaho

Mondrian Schema WorkbenchMondrian Schema Workbench● Instalación

Page 50: Modulo Instalacion Pentaho

Mondrian Schema WorkbenchMondrian Schema Workbench● Instalación

Page 51: Modulo Instalacion Pentaho

Mondrian Schema WorkbenchMondrian Schema Workbench

● Obtener el PSW de la página http://sourceforge.net/projects/mondrian/files/schema%20workbench/3.6.1-stable/psw-ce-3.6.1.zip/download

● Descomprimir la descarga en la carpeta pentaho/schema-workbench/sudo unzip psw-ce-3.6.1.zip -d /opt/pentaho

● Dar permisos de ejecución sudo chmod +x *.sh ● Arrancar la herramienta spoon desde una terminal:

cd /opt/pentaho/schema-workbench/./workbench.sh

Page 52: Modulo Instalacion Pentaho

Mondrian Schema WorkbenchMondrian Schema Workbench

Page 53: Modulo Instalacion Pentaho

Weka Data MiningWeka Data Mining

Waikato Environment for Knowledge Analysis

(Ambiente para Análisis del Conocimiento de la Universidad de Waikato)

Es un conjunto de herramientas de visualización y algoritmos que se enfoca a la minería de datos y el aprendizaje de máquina escrito en Java. Se puede seleccionar una de 4 interfaces: ●SimpleCli (Interfaz simple de línea de comandos)●Explorer. Formado por varios páneles:

● Preprocess [importa datos de fuente y aplica algoritmos de filtrado y transformación de datos]

Page 54: Modulo Instalacion Pentaho

Weka Data MiningWeka Data Mining

● Classify [Aplica algoritmos de clasificación

estadística y análisis de regresión, estima la exactitud del modelo predictivo]

● Associate [Da acceso a las reglas de asociación aprendidas e intenta identificar todas las interrelaciones importantes entre los atributos de los datos]

● Cluster [Aplica técnicas de agrupamiento o clustering como el K-means]

● Selected atributes [Aplica algoritmos para identificar los atributos más predictivos de un conjunto de datos]

Page 55: Modulo Instalacion Pentaho

Weka Data MiningWeka Data Mining

● Visualize [muestra los datos con una matriz de puntos dispersos “scatterplot” y permite la selección de puntos para su análisis individualizado]

●Experimenter (Permite la comparación sistemática de una ejecución de algoritmos predictivos de Weka sobre una colección de datos) ●Knowledge Flow (Como el anterior pero permite el aprendizaje incremental)

Page 56: Modulo Instalacion Pentaho

WEKAWEKA● Instalación(sudo apt-get update)sudo apt-get install weka

Page 57: Modulo Instalacion Pentaho

WEKAWEKA● Ejecutar sudo java -jar /usr/share/java/weka.jar

● Desinstalarsudo apt-get remove --auto-remove wekasudo apt-get purge --auto-remove weka

Page 58: Modulo Instalacion Pentaho

Pentaho Report DesignerPentaho Report Designer

PRD

Es la herramienta para la elaboración de reportes y puede generarlos en los formatos PDF, Excel, HTML, Texto, XML y CSV. Este editor permite integrar gráficas y tablas de consultas SQL sobre una BD para la presentación de nuestros reportes, así como imágenes (logos) y texto para dar una presentación profesional a los reportes para su publicación.

Page 59: Modulo Instalacion Pentaho

Pentaho Report DesignerPentaho Report Designer● Instalación

Page 60: Modulo Instalacion Pentaho

Pentaho Report DesignerPentaho Report Designer● Instalación

Page 61: Modulo Instalacion Pentaho

Pentaho Report DesignerPentaho Report Designer● Instalación Windows

Page 62: Modulo Instalacion Pentaho

Pentaho Report DesignerPentaho Report Designer

Instalación Ubuntu

● Obtener el PRD de la página http://sourceforge.net/projects/pentaho/files/Report%20Designer/

● Descomprimir la descarga en la carpeta pentaho/report-designersudo unzip prd-ce-5.0.1-stable.zip -d /opt/pentaho

● Dar permisos de ejecución sudo chmod +x *.sh● Arrancar el reporteador:

cd /opt/pentaho/report-designer/./report-designer.sh

Page 63: Modulo Instalacion Pentaho

Pentaho Report DesignerPentaho Report Designer