Material Big Data

Lanzados ppts informativos de tecnologías BigData: Hadoop, Hbase, Hive, Zookeeper...

Pentaho Analytics. Un gran salto

Ya se ha lanzado Pentaho 7 y con grandes sorpresas. Descubre con nosotros las mejoras de la mejor suite Open BI

La mejor oferta de Cusos Open Source

Después de la gran acogida de nuestros Cursos Open Source, eminentemente prácticos, lanzamos las convocatorias de 2017

29 ene. 2010

Interesante benchmark entre Infobright, LucidDB e InfiniDB

Hace unos días, desde mysqlperformance blog se publico una comparativa muy interesante entre tres de algunos de los principales motores de bases de datos open source actuales (Infobright, LucidDB, Infinidb) orientados a columnas, con los rendimientos para un esquema en estrella.

benchmark

Debemos tener en cuenta que InfiniDB soporta ejecución paralela, algo que no tienen los otros dos. Como podréis imaginar, siempre que se realiza un benchmark de este tipo surge un debate alrededor bastante interesante (generalmente, bajo el concepto de que hay elementos dificilmente comparables). No es lo mismo un kilo de paja, que uno de plomo.
También, por si alguno lo echaba en falta, hay comparativas con MonetDB. Ver benchmark.

27 ene. 2010

Mas sobre Data Mining Open Source, R

Si en la última entrada os comentábamos sobre las últimas novedades de Weka, la solución de Minería de Datos integrada en Pentaho, hoy os comentamos sobre el otro motor de minería de datos más conocido, R. se puede integrar con Pentaho, o por lo menos es lo que parece demuestra este video (aun no lo hemos probado, ya os contaremos)


R with Pentaho

Via: AnalyseThis

26 ene. 2010

Que hay de Weka

Weka, es la solución de Data Mining que se incluye en Pentaho. El Data Mining es un área cuyo uso no está tan extendido en las Organizaciones, mayormente, por la falta de técnicos y especialistas en la materia dentro de las mismas.

Weka1

Por nuestra experiencia, es mucho más habitual la implementación y uso del resto de módulos de Pentaho: ETL, Mondrian, Report Desginer, Pentaho Metadata, Dashboards que el uso de la minería de datos. Sin embargo, su potencial es enorme y su integración con Kettle cada vez mayor. En otras ocasiones ocurre que las organizaciones indican necesitar Data Mining, cuando realmente, la necesidad suele estar centrada en Segmentaciones, comparativas, etc... que se pueden resolver con tecnología OLAP.


Weka1

Por ello, el documento que os podéis descargar desde aquí, que muestra un update de la tecnología de Weka es realmente recomendable.
También podéis ver la documentación de la última versión de weka.

22 ene. 2010

Convocatoria Workshops BI Open Source en Madrid

Logo_para_Stratebi2

Se convocan nuevos Workshops sobre BI Open Source en Madrid (sobre herramientas Pentaho, Eclipse Birt, Mondrian, Kettle, Talend...), dado el interés que están despertando estas jornadas, que ya hemos realizado con anterioridad en Madrid, Barcelona, Valencia, Málaga, La Coruña, etc...

Web con toda la información de los Workshops

En esta ocasión lo estructuramos en 5 jornadas, repartidas en dos semanas (ver Temarios al final):
Duración:(9:15 - 18:00) con hora y cuarto para comer. Desayuno incluido en el precio.

Los cursos se realizarán en el Hotel Abba Castilla Plaza.

1. Introducción y Configuración (Arquitectura), (8 de Marzo, Lunes)
2. ETL
-DW (9 de Marzo, Martes)
3. Reporting (10 de Marzo, Miercoles)
4. OLAP, Mondrian (15 de Marzo, Lunes)
5. Dashboards y Arquitectura avanzada (16 de Marzo, Martes)

UI_Pentaho

¿Quién debe asistir?
¿Como puedo apuntarme?

Precio por inscripción a cada Workshop: 295 euros
Precio por inscripción a los 5 Workshops: 1.275 euros (cada Workshop a 255 euros)


Confirmar el Registro mediante transferencia a la siguente cuenta y envío de mail de confirmación a info@stratebi.com o llamar al 91.788.34.10

10% de descuento sobre estos precios si el registro es antes del 19 de Febrero!!!

2038-1092-36-6000549149 STRATEBI BUSINESS SOLUTIONS, SRL
1 Workshop 342,2 euros(precio con IVA). Formación completa (5 workshops): 1.479 euros (precio con IVA)
Con descuento (antes del 5 de Febrero) 308 euros por workshop y 1.331 euros por la Formación completa (ya con IVA)

En el correo incluir los datos para realizar la factura correspondiente, así como indicar a que workshop se apunta o si es la Formación Completa.

pdf-icon

Descargar Temarios

- Introducción, Arquitectura y Deploy.
-
Diseño y Construcción de DW. ETL (Kettle).

- Analisis Multidimensional OLAP-Jpivot,

- Reporting Open Source.
-
Cuadros de Mando, Scorecard (KPI´s)

Ver ejemplos en el Canal YouTube de Stratebi.


Mejoras en Jpivot

Os mostramos una serie de mejoras que le hemos estado haciendo al 'viejo' Jpivot, que nos son de utilidad en nuestros desarrollos e implementaciones a clientes, mientras el nuevo PAT va cogiendo velocidad. Le llamamos STPivot.




Estas mejoras vienen derivadas del uso y peticiones por parte de los usuarios. Como nuestra idea es añadirle nuevas funcionalidades y mejoras, pero que también lo puedan usar todos los desarrolladores que les pueda ser de utilidad y para que todos podáis mejorarlo, lo colgaremos próximamente para que todos os lo podaís descargar libremente. Si alguno tiene una necesidad inmediata, que se ponga en contacto para facilitarlo!!

De momento os dejamos un video que muestra algunas de las funcionalidades y una lista de las mismas:

- Arquitectura AJAX con nuevo diseño del GUI.
- Editor de MDX con resaltado de código.
- Panel de navegación con actualización asíncrona.
- Personalización de los elementos de dimensión. Se pueden abrir gráficas, información, etc para los elementos.
- Inclusión de medias y totales por columnas.- Gráficas JFree redimensionables.


21 ene. 2010

20 ene. 2010

Todo lo que no son cuentas, son cuentos

Crimespotting

Ya veníamos comentando que la explotación de datos públicos con herramientas Business Intelligence (y cada vez más Open Source) es una tendencia que se viene extendiendo para beneficio de ciudadanos y contribuyentes. Obama ya lo ha puesto en marcha y lo volvíamos a contar por aquí.

En esta ocasión es el Ayuntamiento de Londres, con su controvertido Alcalde a la cabeza, Boris Johnson, el que ha decidido liberar las Bases de Datos Municipales para uso público.
Se va a crear un Datastore en donde se liberará una ingente cantidad de datos públicos para uso libre por parte de los ciudadanos, empresas y organizaciones.
Se podrán crear mashups, widgets y todo tipo de aplicaciones con dichos datos.

El llamado “London Datastore”, cuenta con un gran número de indicadores sobre la evolución y situación del municipio: criminalidad, clima, contaminación, ejecución presupuestaria, etc...

Objetivo:
Hacer transparente para los ciudadanos la actuación de sus governantes mediante datos concretos y exactos alejados de la retorica, como dice la famosa frase que me encanta, atribuida, aunque discutible, al padre del actual presidente del Banco Santander: "Todo lo que no son cuentas, son cuentos".

El sitio ya esta abierto con más de 40 Bases de Datos que pueden ser consultadas. El origen de esta tendencia que como os venimos contando se está arraigando más y más viene de los EEUU (no solo por la iniciativa de Obama antes mencionada), sino por que ciudades como San Francisco y Chicago ya liberaron sus datos, como nos dicen en The Guardian.

Nosotros, llevamos tiempo trabajando en estos temas e impulsando su uso en España en Administraciones Públicas, pues estamos seguros que como en otras ocasiones, todo lo que viene del mundo anglosajón acaba llegando a España.

Os dejamos unas pinceladas de nuestra propuesta (TodoBI-Stratebi). Todo aquel interesado que contacte con nostros.


DataStore y Scorecard para Administraciones Públicas

Diagrama de Arquitectura:

Diagrama


Ejemplos de Indicadores o KPI´s (tenemos recopilados más de 250)

KPI 1 KPI 2


Objetivo:

Organismos Púlicos de todo el mundo (Ayuntamiento de Nueva York, Johannesburgo, Edimburgo…), están creando Cuadros de Mando Web, de los principales indicadores que pueden interesar a los ciudadanos.

Necesidad para las AAPP Municipales:- Trazar los índices e indicadores clave que pueden interesar a los ciudadanos.
- Eficiencia Económica. (presupuestos disponible, ejecutados…)
- Desarrollo Económico Sostenible (Nº empresas, tipo, explotaciones
industriales…)
- Equilibrio Medioambiental y Urbanístico (masa forestal, indicadores de
contaminación, control urbanístico…)
- Equilibrio de las haciendas locales (impuestos, tasas, orientación…)
- Mejorar el empleo, número y calidad de las empresas.
- Mejora de la Calidad para los ciudadanos ‘medible’: nº hospitales,
guarderías, espacios púlicos, tasa delincuencia…

- Minimizar los efectos negativos de la población estacional.
- Fomentar el acceso a la vivienda (demandantes de vivienda por sexo, edad,
renta…)
- Potenciar los planes de integración social.


Beneficiarios:
Estos desarrollos creemos que cuentan con dos grandes beneficiarios: Los ciudadanos y las
Administraciones Públicas.

Los ciudadanos, podrán realmente conocer, comparar y evaluar el funcionamiento de los servicios públicos que reciben, mediante el análisis de los principales indicadores que le son de relevancia.
Además, los ciudadanos podrán aportar sus sugerencias de mejoras, nuevos indicadores a medir, prioridades, mediciones, etc… que hagan mejorar el modelo y, por tanto, la utilidad del Sistema.


Las Administraciones Públicas, tendrán una herramienta única para el seguimiento, control interno y comunicación externa a los ciudadanos de todas las iniciativas que se están llevando a cabo de forma que se favorezca el objetivo de transparencia, control interno y eficacia de las políticas públicas.

Dash1

Es un enfoque con el que creemos que la transparencia en la información va a redundar en credibilidad para las administraciones e información para los ciudadanos.
Y lo que os comentaba antes: 'Todo lo que no son cuentas, son cuentos'.

19 ene. 2010

Preparandose nuevo libro Oficial sobre Kettle

pentaho-kettle

Tras la buena acogida que están teniendo los libros sobre BI Open Source: Nosotros ya tenemos los de Pentaho Solutions, Report Designer, BIRT... ahora le llega el turno a Kettle.

La ediorial Willey, la misma del Libro de Pentaho Solutions, ha encargado a Jos Van Dongen y Matt Casters, la elaboración de este libro.

Todavía queda, pero lo esperamos con interés!!

18 ene. 2010

Birt Plugins

Para todos aquellos que usais Eclipse Birt (en TodoBI-Birt) en vuestros proyectos y desarrollos. Nosotros lo hacemos y os lo recomendamos, os referimos unas extensiones para Birt que os podrán ser de utilidad.


CustomFunctions
Se trata de 'Extension Points' que permiten añadir cálculos personalizados complejos para poder integrar en el User Interface de Birt.

En concreto, el proyecto alojado en Google Code incluye:

- Aggregate Extension
- Script Function Extension


Para saber como usarlos, echad un ojo a la guía.

Salvemos MySQL



Desde estas páginas, aunque no estamos en contra de la libre competencia (si lo estamos de los monopolios), por lo que la iniciativa que os indicamos nos parece loable: Salvemos MySQL

Para asegurar las innovaciones futuras en relación a MySQLy proteger a MySQL como uno de los principales competidores

Firmar la petición

Tutoriales de instalacion de Pentaho BI Server

pentaho


Os dejo el enlace a unos tutoriales actualizados (versión 3.5) para instalar y configurar Pentaho en varias Bases de Datos y Sistemas Operativos:

Windows
MySQL 5.x
View
PostgreSQL 8.x.x
View
Oracle XE, 10g & 11g
View

Linux
MySQL 5.x
View
PostgreSQL 8.x.x
View
Oracle XE, 10g & 11g
View


Via: AnalyseThis

13 ene. 2010

Cuadro de Mando sobre películas alquiladas

blogSpan

.... En TodoBI nos encanta la visualización y como está mejorando la infografía de los medios de comunicación en Internet. Un buen ejemplo. Como ver las películas más alquiladas por distritos usando Google Maps, de la compañía de alquiler Netflix.

Acceder al Cuadro de Mando de NYTimes.

Por que es interesante?


- Supone un paso de calidad en la infografía de los medios de comunicación en Internet, para proporcionar grandes cantidades de datos a los lectores de forma intuitiva.
- Es una gran ejemplo de utilización de Google Maps Mash-ups
- Abre las puertas al uso conjunto de información+visualización+análisis a cualquier ciudadano o lector de a pie.

Gracias por poder hacer lo que nos gusta

thanks

En este post queríamos agradecer a todas aquellas personas (clientes, partners, lectores, colaboradores, etc...), que durante este último año hemos tenido la suerte de trabajar junto a ellos en lo que más nos gusta: El Business Intelligence y, además, poder hacerlo con ellos de la forma más interesante y creemos más útil: potenciando la investigación, innovando, arriesgando en nuevas tecnologías y enfoques, usando software libre, etc...

A modo de referencia, nombramos a algunas de dichas personas que nos lo han dejado hacer posible:
Goyo, Enrique, Chema, Pedro, Clara, Ghil, Sean, Jose Antonio, Mª Jose, Marcos, Belén, Kike, Mikel, Mario, David, Vinici, Enric, Joan, Albert, Jordi, Josu, Ohiana, Ana, Eduardo, Raquel, Ferrán, Martín, Emilio, Lucía, Jeroni, Pedro, Mª Jose, Caio, Josep María, Jordi, Antonio, Diego, Aurelio, Jorge, Ferrán, Ana, JLMarina, Chico, SergioM, Juan Jose, Javier, Oscar, Carles, Laura , Leo, David, Roberto….

11 ene. 2010

PAT, el visor OLAP de la comunidad de Pentaho sigue avanzando

Como ya comentamos hace poco, aunque Pentaho había incorporado un nuevo visor OLAP (el antiguo Clearview de Lucidera), tirando de chequera, los desarrolladors de la comunidad, con Tom Barber a la cabeza, siguen en su empeño de crear una solucion totalmente Open Source de similares funcionalidades y poco a poco.. se van acercando. Lo último es el plugin para integrarse en Pentaho. Unas imágenes:

PAT1

PAT2


Enlace para descargas

8 ene. 2010

Integrando BIRT con Pentaho
























Aunque Pentaho tiene su propio tutorial vamos a hace una traducción resumen de como integrar Birt 2.5.1 con Pentaho 3.5:

Lo primero es poner el listener en:
pentaho-solutions/system/systemListeners.xml

Para ello añadiremos el bean a la lista de listeners:

Te bajas el runtime de Birt que toque. En este caso el 2.3.2

Borras todo lo que hay en :

pentaho-solution/system/BIRT/configuration
pentaho-solution/system/BIRT/plugins

Pones ReportEngine/configuration/config.ini del runtime que te has bajado en pentaho-solution/system/BIRT/configuration
Pones todo lo que hay en ReportEngine/plugins del runtime en pentaho-solutions/system/BIRT/plugins
Pones los Drivers (JARS) que vayas a utilizar en pentaho-solutions/system/BIRT/plugins/org.eclipse.birt.report.data.oda.jdbc_2.5.1.v20090821.

Puedes copiar directamente los que tienes en tomcat/common/lib.

Pones todo lo que hay en birt-runtime/ReportEngine/lib en tomcat/webapps/pentaho/WEB-INF/lib y borras las versiones antiguas de los jars por ejemplo si tienes chartengineapi.jar y chartengineapi-2.2.1.jar borras la vieja.

Repito borras la vieja la que estaba antes, en este caso chartengineapi-2.2.1.jar

Y ya puedes probar!!

Y comprobar que ejecuta los informes pero no renderiza ni links ni graficos.


4 ene. 2010

Lo mas visto del 2009

2009 review

Como agradecimiento a todos nuestros lectores, que nos siguen cada vez en mayor número, os incluimos la lista de post más populares durante este último año:

1. Demos Online Pentaho.
2. Pentaho Developers en Barcelona
3. Tablero Futbolero
4. El Estudio BI Open Source mas completo
5. Jovitae, la web del empleo Open Source
6. BI Termometer
7. Visores OLAP Open Source
8. Resolucion de Bug de Birt con Pentaho
9. Libro La Gacela de Wirayut
10. Video del BI Open Source en la WhyFloss