Material Big Data

Lanzados ppts informativos de tecnologías BigData: Hadoop, Hbase, Hive, Zookeeper...

Pentaho Analytics. Un gran salto

Ya se ha lanzado Pentaho 7 y con grandes sorpresas. Descubre con nosotros las mejoras de la mejor suite Open BI

La mejor oferta de Cusos Open Source

Después de la gran acogida de nuestros Cursos Open Source, eminentemente prácticos, lanzamos las convocatorias de 2017

30 jul. 2012

Mobile Business Intelligence

All the power and ease of use of business intelligence at your fingertips from mobile devices, using technology based on Open Source as Pentaho Reporting, OLAP Mondrian, Kettle ETL... by experts in Open Source Business Intelligence Stratebi

26 jul. 2012

Pentaho Big Data Analytics Center

Una gran iniciativa de Pentaho, que está liderando el desarrollo de soluciones analíticas para Big Data, con la creación de este Portal:  Pentaho Big Data, que proporciona una gran información y ayuda para conocer todas las posibilidades que tenemos al alcance de la mano,


24 jul. 2012

23 jul. 2012

Un mapa estilo 'Vintage' para los amantes del cine

Un gran ejemplo de visualización. Te imaginas ver tus películas favoritas reflejadas en un mapa?















































Visto en DesignTaxi

22 jul. 2012

Palestra Gratuita sobre Open Business Intelligence e Social Intelligence

Para todos los amigos de TodoBI que estéis y nos seguís en Brasil (si queréis que hagamos uno parecido en España u otro lugar, no dejéis de indicarnos):


IT4Biz & Stratebi gostaria de convidar-te à palestra de apresentação de Open Business Intelligence, que será realizada no próximo dia 25 de julho 2012 às 18.30. Não só falaremos de Pentaho, como também falaremos sobre soluções de Business Intelligence Open Source divididas por setores, e comentaremos os nossos desenvolvimentos de STDashboard, STPivot e Open Social Intelligence. Este evento é totalmente gratuito, e para participar você só precisa se cadastrar
Dúvidas: br@stratebi.com ou info@it4biz.com.br




Saiba mais sobre Open Social Intelligence
Fazer análise de marketing nas mídias sociais é muito importante. Já tentou saber a porcentagem de pessoas que curtiram uma publicidade, e ver o que elas curtem? Você pode analisar que dos 800 "curtis" em uma foto, 30% são mulheres, e dessa porcentagem 60% são casadas. Não só isso, você pode ver e analisar quase todos os dados que estão nas redes sociais com ferramentas OpenSource, como o Pentaho.

 


20 jul. 2012

Modelo de Datos Abiertos de la Generalitat de Cataluña

Muy interesante y bien explicado....

 

19 jul. 2012

Con el uso de software libre en España se ahorraría más de 5.000 millones de euros

Interesante iniciativa la expuesta en la web change.org:

Al gobierno de España: Apuesta por software libre para evitar los recortes en sanidad o educación,
Ya llevan cerca de 500 adhesiones

La comisaria europea Neelie Kroes con afirmaciones a favor del software libre tan contundentes como: "se trata de un desperdicio de dinero que en estos tiempos de crisis “la mayoría de las Administraciones públicas ya no se pueden permitir”.

Se citan algunos ejemplos de ventajas económicas que está suponiendo el uso de Software Libre, en paises como EE.UU y Dinamarca


Cada día más entidades y administraciones públicas deciden apostar por el software libre. En la mayoría de ocasiones, motivados por todos los beneficios que cada vez son más conocidos y por un importante ahorro de costes a medio plazo. EEUU en el año 2009 ahorraba 3.700 millones de dólares con software libre  y en el 2010, si se hubiese empleado software libre en la administración española no hubiese sido necesario congelar las pensiones: 1.412 millones de euros.

18 jul. 2012

Ventas de Vivienda en España, Business Intelligence con Open Data


Con esta aplicación, se puede hacer un seguimiento de las Ventas de Viviendas en España (tanto libre, como protegida). También se tiene acceso a la información de precios de vivienda libre y protegida, así como de Tasaciones. Nuestros compañeros de Stratebi la han dejado disponible en:


Toda esta información está disponible para todas las provincias españolas, pudiendo hacer análisis agrupados por Comunidades Autónomas. Se dispone de datos desde el 2008, subdivididos en trimestres. Los datos han sido obtenidos de la web oficial del Ministerio de Fomento.
 
Esta aplicación se apoya en el uso de Datos Abiertos, como hablamos tras asistir al último evento Open Data celebrado en Madrid, y en potentes herramientas Business Intelligence, basadas en tecnología Open Source, para la elaboración de los modelos, carga de los datos y explotación analítica (OLAP y Cuadros de Mando). Este tipo de aplicaciones puede ser utilizada de igual forma en gran número de sectores y áreas.
Para ello se ha usado soluciones Open Source en las que somos primeros especialistas en España y mejoras realizadas por nosotros a nivel de análisis OLAP y Cuadros de Mando: Kettle, Pentaho, SchemaWorkbench, Pentaho Report DesignerSTDashboard, STPivot, etc. 




17 jul. 2012

Aleluya!! IDC dice que el Business Intelligence seguirá creciendo

No deja de ser un tanto irónico el título del post, pues este tipo de estudios siempre suelen ser muy positivos y optimistas y rara vez se publicitan tendencias negativas o sobre tecnologías en desuso, no se vayan a enfandar los 'sponsors' de los estudios.  En cualquier caso, nos alegramos de ello.
En esta ocasión parece que el impulso se lo dará el Big Data, lo que en cualquier caso, a todos los que nos dedicamos al BI no deja de ser una gran noticia. La gente de IDC indica que crecerá a un ritmo de un 9,8% anual


Additional key findings from IDC's research include:
  • As more organizations with less business analytics experience are becoming interested in this technology, vendors and users will have to devote more resources to business analytics services.
  • A growing emphasis on industry and business process–specific analytic applications is going to take hold over the forecast period. This will be a long-term trend that is likely going to accelerate M&A activity in the business analytics market. Recent acquisitions by large business analytics vendors will require these vendors to execute go-to-market strategies that depend on ever finer segmentation of target audiences by industry, region, and organization size.
  • The growth in appliances, SaaS, and outsourcing deals for business analytics technology will likely mean that end users will pay increasingly less attention to specific technology components, instead focusing on the business value arguments and overall functionality. System performance, availability, security, and manageability will all matter greatly, but how they are achieved will be less of a point for differentiation amongst vendors.


7 Tips for Effective Data Visualization

Interesante reflexión de Information Management sobre visualización, que nos alegramos ver que coinciden con algunas de las cosas que contábamos hace unos meses


1. Establish What Users Will Do With Results
2. Let the Users Lead
3. Talk to the Users
4. A Picture is Worth a Thousand Numbers
5. From Analytics to Action
6. Don’t Automate Everything
7. Design Principles


16 jul. 2012

Open Data en el The developers conference - TDC 2012


El pasado viernes 6 de Julio se celebraban una serie de charlas sobre Open Data en la conferencia de desarrolladores “The developers conference - TDC 2012” en la ciudad de São Paulo, Brasil. Desde Stratebi nos acercamos por ver qué movimiento social se está llevando a cabo en Brasil.

Estas charlas iban desde la introducción de los datos abiertos hasta cómo poder visualizarlos, casos de ejemplo que se han hecho hasta ahora por los propios creadores, portales que participan en este movimiento social y mundial, cómo modelar APIs, compartiendo datos difíciles de conseguir…etcs. Se puede ver más de la programación en el siguiente enlace

En este post se va a hablar de la charla de introducción que Alexandre Gomes y Christian Morya dieron como apertura del día. Esta charla está disponible a través del siguiente enlace: https://speakerdeck.com/u/alegomes/p/tdc2012-introducao-ao-opendata

Hoy en día existen cientos de APIs de redes sociales que buscan compartir la información personal de los miembros de las mismas: Facebook, Twitter, Flicker, Linkedin…Con todas estas Apis surgen muchísimas aplicaciones tanto para entornos web como para dispositivos móviles. 

También se dice que la mejor reutilización de los datos de una empresa o entidad no será hecho por la propia empresa sino por personas ajenas a la misma que tienen otro tipo de concepto de usabilidad de los datos. Por ello, muchas compañías grandes están creando APIs para la difusión de sus datos, como la famosa cadena de deportes ESPN o la multinacional discográfica EMI. Estas empresas han puesto a disposición de los desarrolladores unas APIs las cuales permiten la creación de aplicaciones con los datos de las compañías. Por tanto, habrá reaprovechamiento de datos y se crearán nuevas formas de reutilizar estos datos, garantizando así que tanto la compañía que ha publicado los datos como la sociedad que los consume salgan ganando.

Hoy en día el gobierno tiene una serie de datos que todos los contribuyentes pagan para tenerlos, tanto de Brasil como de cualquier país del mundo. Es decir, con los impuestos el gobierno está realizando una serie de tareas las cuales recopila y genera nuevos datos que no son explorados por nadie. ¿Por qué en vez de hacer aplicaciones para redes sociales no se desarrollan aplicaciones para la sociedad? ¿Por qué en vez de desarrollar aplicaciones para el entretenimiento no desarrollamos aplicaciones para el bienestar social y la mejora de la calidad de vida de la sociedad? ¿o perseguir gobiernos corruptos?

Desde el movimiento social de datos abiertos de Brasil se insiste en el uso de los datos que tiene el gobierno para posibilitar el análisis de la corrupción de una sociedad, funcionamiento de entidades del gobierno, movimiento sociales, etcs… todos estos desarrollos y explotaciones de los datos gubernamentales quedarían expuestos a la imaginación de las personas para poder construir nuevos recursos gráficos para explotar esta valiosa información.


Por ello, y gracias a los movimientos sociales que están apareciendo, hoy en día los gobiernos están siendo obligados a poner a disposición del ciudadano los datos que han sido recogidos gracias a la financiación del contribuyente. Estos datos pueden poner contra las cuerdas a los gobiernos corruptos y detectar problemas en entidades del gobierno y tomar medidas para mejora la sociedad gracias a las aplicaciones que están surgiendo.

En esta la charla, se comentaron algunos tipos de movimientos sociales que están apareciendo para fomentar el consumo de los datos por parte de la sociedad:

-    Hackton de datos: Maratón de creación de aplicaciones con datos del gobierno. En estos eventos se reúnen en una jornada participantes que desarrollan in-situ aplicaciones para explorar esos datos
-    Sites de difusión de datos: tanto de gobiernos, ayuntamientos y otras entidades públicas que se están subiendo al movimiento. No son pocos:
o   Data.gov.uk ,data.gov, dadosabertos.gov.br , dados.gov.pt… 
-    Aplicaciones creadas hasta la fecha en Brasil: www.paraondefoimeudinheiro.com.br site que muestra dónde se ha invertido el presupuesto del estado.


Ejemplo Bicing
    
Por último, dejar 2 definiciones en las cuales se ha hecho mucho incapie a lo largo del día:
Nos paramos a analizar las definiciones de datos abiertos y datos gubernamentales abiertos:
“A piece of content or data is open IF ANYONE IS FREE TO USE, REUSE, AND REDISTRIBUTE IT” www.opendefinition.org

Definición de Datos gubernamentales abiertos:
“Open Government Data is public government records that is shared with the public digitally, over the internet, in a way that promotes analysis an reuse” http://opengovdata.org

Ejemplos que hemos creado en Stratebi con Datos Abiertos:

12 jul. 2012

Aplicacion Business Intelligence de la Liga Brasileña de Futbol


Ya estaba disponible la aplicación para la Champions League y la Liga BBVA de España. Ahora tenemos un nuevo miembro!!, el Brasileirao.


Esperemos que os guste. Incluye una gran variedad de información, análisis, Cuadros de Mando, etc... y con una forma muy sencilla de navegar (estamos incluyendo nuevas mejoras, por lo que cualquier sugerencia será agradecida).
En posteriores post iremos detallando todas las métricas y cruces que están disponibles 
Dicha aplicación está basada en componentes Open Source como Pentaho, Mondrian, Kettle...



10 jul. 2012

Birt 4.2 ya disponible

Hacía tiempo que no comentábamos ninguna actualización de uno de nuestros motores de reporting Open Source preferidos: BIRT. Acaba de estar disponible la nueva versión 4.2 con buenas mejoras. Ver las novedades




Como hacer Cuadros de Mando, VideoTutorial

Ya hemos alcanzado las 1.000 reproducciones de nuestro VideoTutorial sobre Como crear Cuadros de Mando partiendo de soluciones Open Source.
A esto se añade que nuestro VideoTutorial anterior de 'Introducción a Pentaho' va por los 10.000. Gracias!!

6 jul. 2012

Caso de Estudio BI Open Data: Bicing II parte

En la anterior entrada hemos hecho un pequeño caso de estudio Open Data y de aplicación práctica del Business Intelligence sobre los datos del Bicing de Barcelona. Y hemos visto cómo el principal uso que se le da al servicio de Bicing, a tenor de los datos, es para ir a trabajar.

Si nos fijamos, hay dos patrones, las estaciones que son usadas "para ir a trabajar" y las que son usadas para "venir a trabajar". Esto se puede ilustrar fácilmente con las siguientes 2 estaciones:

La estación 127 - Aragó 661  Si nos fijamos empiezan a bajar las bicicletas disponibles  desde las 7:30 hasta las 8:30 que es el intervalo horario donde la gente suele ir a trabajar:




En cambio, si miramos una estación ubicada en un sitio donde hay oficinas alrededor, cómo puede ser la estación  375 -  World Trade Center que está ubicada en el conocido edificio de oficinas, vemos cómo las bicicletas empiezan a acumularse desde las 8 hasta las 9 de la mañana que llega a su punto álgido, a la hora que normalmente la gente entra a la oficina:

De hecho esta comparativa suscitó una tercera gráfica.... Comparar los usos de cada día, para ver cómo se comporta una misma estación durante los diferentes días de la semana.  Por lo que gracias a la flexibilidad y facilidad que nos proporciona Pentaho y las ctools de webdetails  la hemos puesto "en un plis plas"

Fijaros en la diferencia entre un lunes y un domingo en la estación  127 - Aragó 661 :



El lunes la gente coge las bicis para ir a trabajar, hasta que se quedan sin bicicletas (esto me ha pasado). Alrededor de las 9 viene una furgoneta reponedora y vuelve a llenar la estación  que a partir de ese momento fluctúa con el uso normal. Pero el domingo... hasta las 11 no hay apenas movimiento y en realidad es un trafico inverso, la gente viene a este punto.

Es interesante ver cómo en este gráfico tenemos 3 representaciones  de los mismos datos  que nos proporciona diferente información . En este caso temporal:

  • La evolución diaria que nos indica que día hubo más o menos bicicletas de media teniendo que el martes (26) fue el peor día para encontrar una bicicleta en esta estación.
  • La evolución intra-dia que nos permite ver la evolución minuto a minuto a minuto los mejores y peores momentos para coger una bicicleta en esta estación. Quizás merece la pena madrugar 5 minutos para asegurarse de que habrá una bicicleta, si no, mejor esperar a que sean las 9.
  • La comparativa de los diferentes días para ver cómo se comporta la misma estación un lunes y un domingo, por ejemplo.
Pero todo esto nos lleva a la siguiente pregunta.... Dónde se ubican las mejores y las peores estaciones? Hemos visto las estaciones ... ¡Pero ahora queremos visualizarlas espacialmente!  ¿Las peores son las del centro? ¿donde están las mejores? Para eso nada mejor que pintarlas en un mapa. Bueno, en realidad en 2 Mejores Vs Peores:



(ir al dashboard)
Esta comparativa de mapas nos permite ver las mejores Vs las peores estaciones en las últimas 2 semanas. Podemos ver que, las peores se encuentra normalmente en el centro con algunas excepciones cómo la estación  510 - Radi, 11  que parece abandonada  o estropeada ya que la que hay justo al lado, 352 - Radi, 10 es una de las mejores. Pero dejando de lado esta anécdota podemos ver  2 patrones claramente diferenciados  entre las mejores estaciones (las que más bicicletas disponibles tienen) y las peores.

Y dado que ya me estoy extendiendo mucho.... eso lo dejaremos para un siguiente post de este interesante caso de estudio.

5 jul. 2012

Visualización de Datos, las lecciones de la Historia

Gran presentación de Gaetan Gaborit, presentado en la Semana Europea del Open Data, recientemente celebrada en Nantes, muy ilustrativa de gran cantidad de temas de los que hablamos en este Portal y, que además nos encanta.

 

Un renacimiento del Business Intelligence

Según comenta Justin Kern, de Information Management apunta en esta dirección.

Básicamente, se está produciendo una variada conjunción que nos podría llevar a pensar en ello:

- Cada vez el Business Intelligence se usa por más areas, organismos, empresas (hasta Deporte y Open Data)
- Cada más perfiles difrerentes de usuarios acceden a herramietnas BI, con sus diferentes necesidades.
- Cada más datos y con formatos, estructurados o no, son almacenados y susceptibles de ser analizados.

Para ello se basa en el estudio de Howard Dresner, “Wisdom of Crowds: Business Intelligence Market Study,”. Son comentarios muy optimistas:

”We’re in the midst of the rising tide, so the whole market feels like it’s growing, and we haven’t had that in a while,” Dresner says.


Fuente: Information Management

4 jul. 2012

Probando Saiku Reporting


Con motivo de le la reciente liberación de Saiku Reporting 1.0 GA vamos a hacer una pequeña revisión de lo que nos ofrece.
Para ello, y cómo de costumbre, lo primero es instalarlo. Para ello sólo hay que seguir los pasos que en la propia página indican:
  1. Descargar el CDA-Plugin de la página  cda.webdetails.org e instalarlo en nuestro bi-server
  2. Descargar saiku-adhoc-plugin-1.0-GA.zip y descomprimirlo dentro de biserver-ce/pentaho-solutions/system.
  3. Si quieres exportar los informes a PRPTs copia o actualiza el jar pentaho-reporting-engine-classic-extensions-cda-xxx.jar que hay en pentaho/web-inf/lib con el que viene en el zip que acabas de descomprimir y que debería estar en  biserver-ce/pentaho-solutions/system/saiku-adhoc/lib
  4. Para definir las ACL de los nuevos informes añade la extensión .adhoc al archivo de acls en pentaho.xml
  5. Reinicias el BI-Server
  6. A disfrutar!
Nuestro compañero Juanjo lo ha hecho y el resultado es este:



También lo podéis ver en funcionamiento de nuestra Demo, de Stratebi, atacando datos de Sector Público, Estadisticas Deportivas, ventas de vivienda, etc...

Por cierto…   también está contento de ver un relevo a waqr … nosotros también. 

Aunque bien es cierto que aun tiene algunos puntos que mejorar: Para algunos de nuestros clientes en producción usando waqr, hemos observado que para grandes volumenes de datos se comporta mejor waqr que Saiku Reporting... un punto que seguro que va mejorando proximamente,

3 jul. 2012

Como se siguio desde Twitter cada equipo en la Eurocopa

Muy interesante la representación gráfica de tweets de cada equipo durante toda la Eurocopa. Euro2012_tweets
En la final también se ganó a Italia en número de tweets, aunque en este caso el resultado fué mucho más ajustado.