Material Big Data

Lanzados ppts informativos de tecnologías BigData: Hadoop, Hbase, Hive, Zookeeper...

Pentaho Analytics. Un gran salto

Ya se ha lanzado Pentaho 7 y con grandes sorpresas. Descubre con nosotros las mejoras de la mejor suite Open BI

La mejor oferta de Cusos Open Source

Después de la gran acogida de nuestros Cursos Open Source, eminentemente prácticos, lanzamos las convocatorias de 2017

25 mar. 2010

GetPivot, la apuesta de Microsoft

GetPivot, es la apuesta de microsoft para manejar y navegar con grandes cantidades de datos.
No dejéis de echarle un vistazo.


GetPivot

24 mar. 2010

Liferay cambia de licencia


De MIT a LGPL, puede que algún grupo de usuarios les pueda suponer una limitación, pero no debería afectar a su desarrollo futuro. Desde la version 6.

Anuncio del cambio de licencia.

23 mar. 2010

Guante recogido, Ejemplo de BI con Datos Publicos.





No puedo por más que dar las gracias al excelente post que se ha marcado Roberto Espinosa, cuando lanzamos al aire la búsqueda de fuentes de datos públicos en abierto para poder utilizar, además promete utilizar gran parte de estos datos usando Talend y Microstrategy, para montar un sistema BI.


Lo dicho, excelente post y recopilación... seguro que seguiremos aumentándola!!



22 mar. 2010

The Guardian Open Platfform, me encanta

The Guardian

Iniciativa más que interesante con datos públicos para ser utilizados por todo aquel que los necesite, como ya apuntábamos hace unas semanas.

Esperemos que los medios españoles también lo generalicen.

20 mar. 2010

PAT 0.6 y Roadmap para 1.0

Ya podeis descargaros la presentación de los desarrolladores de PAT de la versión 0.6 donde también daban algunas ideas de por donde iría el roadmap para la versión 1.0
Paul y Tom buscan ayuda en diseño, desarrollo, etc... para mejorar PAT!!!

Descargar presentación.

PAT2

PAT3

Ver demo.
Ver Webinar grabado.

18 mar. 2010

Guia de Estudio DSS




Joseph di Paolantonio, gran conocedor de los sistemas BI Open Source, anuncia en su blog que va ir publicando una serie continua de posts a modo de Guía de Estudio para un sistema DSS, basado principalmente en sistemas Open Source, lo cual promete.

Objetivos que se propone, para explicar que es un sistema DSS:

- Qué siginifica realmente este término.
- Cómo se puede construir un sistema DSS razonable con soluciones Open Source.
- Qué fuentes y recursos tenemos para aprender.

Recursos de partida en los que apoyarse:

1. Bayesian Computation in R by Jim Albert, Springer Series in UseR!, ISBN: 0-38-792297-0, Purchase from Amazon, you can also purchase the Kindle ebook from Amazon
2.
R in a Nutshell by Joseph Adler, ISBN: 0-59-68017-0X, Purchase from Amazon
3.
Pentaho Solutions; Business Intelligence and Data Warehousing with Pentaho and MySQL, by Roland Bouman and Jos van Dongen, ISBN: 0-47-048432-2, Purchase from Amazon
4.
Pentaho Reporting 3.5 for Java Developers by Will Gorman, ISBN: 1-84-719319-6, Purchase from Amazon
5.
Pentaho Kettle Solutions: Building Open Source ETL Solutions with Pentaho Data Integration by Matt Casters, Roland Bouman & Jos van Dongen, ISBN: 0-47-063517-7 due 2010 September, Pre-Order from Amazon
6.
Data Mining: Practical Machine Learning Tools and Techniques by Ian H. Witten and Eibe Frank, Second Edition, Morgan-Kaufmann Series in Data Management Systems, ISBN: 0-12-088407-0 a.k.a. "The Weka Book", Purchase from Amazon, Pre-Order the Third Edition, you can also purchase the Kindle ebook from Amazon
7.
LucidDB online documentation
8. Pertinent information from
Eigenbase
9.
LudidDB mailing list archive on Nabble
10. Anything I can find on
PAT
11.
Pentaho Community Forums, Wiki, WebEx Events, and other community sources
R
Mailing Lists and Forums
12. Various
Books in PDF from The R Project
13. Information Management and Open Source Solution Blogs from our side-column linkblogs

16 mar. 2010

Libro Pentaho Kettle Solutions en creacion

9780470635179.pdf

Como ya avanzábamos hace unas semanas, se esta escribiendo un libro que promete ser muy, muy interesante: Pentaho Kettle Solutions.

Y promete ser interesante por que lo firman Matt Casters, Jos Van Dongen y Roland Bouman. Aunque prevista su publicación para después de este verano, ya os podemos anticipar el indice previsto.

# Part I: Getting Started

* ETL Primer
* Kettle Concepts
* Installation and Configuration
* Sample ETL Solution


# Part II: ETL Subsystems

* Overview of the 34 Subsystems of ETL
* Data Extraction
* Cleansing and Conforming
* Handling Dimension Tables
* Fact Tables
* Loading OLAP Cubes


# Part III: Management and Deployment

* Testing and Debugging
* Scheduling and Monitoring
* Versioning and Migration
* Lineage and Auditing
* Securing your Environment
* Documenting

# Part IV: Performance and Scalability

* Performance Tuning
* Parallization and Partitioning
* Dynamic Clustering in the Cloud
* Realtime and Streaming data


# Part V: Integrating and Extending Kettle

* Pentaho BI Integration
* Third-party Kettle Integration
* Extending Kettle


# Part VI: Advanced Topics

* Webservices and Web APIs
* Complex File Handling
* Data Vault Management
* Working with ERP Systems

11 mar. 2010

Estudio del uso de Software Libre en España (universidades y centros I+D)

Cenatic

La gente del Observatorio Cenatic nos pasa la noticia de la presentación del Estudio sobre la situación actual del software de fuentes abiertas en las Universidades españolas y Centros de I+D españoles

Se trata de un documento que os podéis descargar en PDF (ojo, son 8Mb), pero realmente interesante para conocer lo que se está moviendo en las Universidades y los Centros de Investigación en España con el Software Libre que es mucho.

Se trata del primer informe que incorpora información cualitativa y cuantitativa del estado de implantación y uso de las tecnologías libres en el mundo académico e investigador en España. Sus resultados incluyen información estratégica de utilidad para los responsables de la toma de decisiones tecnológicas, y ayuda a comprender los beneficios que el software libre aporta.

Muy interesante, completo y recomendable.

9 mar. 2010

Webinar para comparar MySQL vs Postgre

postgresql

Mañana, miercoles 10 de Marzo (poco tiempo de antelación, lo sé), hay un Webinar muy interesante que ofrece la empresa EnterpriseDB (especializados en soluciones profesionales basadas en Postgre). Web de EnterpriseDB.

Imprescindible para todos los que trabajéis con Postgre!!

En el webinar, durante más de una hora se discutirá sobre los pros y los contras de MySQL y de Postgre, algo que todos los que trabajamos en la construcción de sistemas DW nos será de interés.

A través de Jos van Dongen.

8 mar. 2010

Tendencias Business Intelligence del 2010 segun HP

Business Intelligence trends

Aunque ya con el año empezado, nos cuentan desde el Portal Information Management, cuales son las tendencias que desde HP, creen que serán claves en Business Intelligence durante este año.

Si esto que acabo de comentar en el párrafo anterior alguien lo hubiera leido hace unos cinco años, pensaría que 'que pinta HP pronosticando tendencias en esto del Business Intelligence'; y lo que son las cosas, lo cierto es que HP, es una de esas compañías que decidió dar un giro a su tradicional modelo de negocio Hardware, para adentrarse en el Software y más en realidad en los servicios. Y, liderados por su presidente, dando una importancia máxima al Business Intelligence. Lo comentábamos, ya hace mucho tiempo. HP ha llegado al Business Intelligence para quedarse.

En cualquier caso, las tendencias, que dicen haber extraido de encuestas realizadas a clientes e interesados durante una serie de Conferencias del 2009, tienen un valor indudable (por cierto, van muy en la linea pronosticada por otros medios):

1. Increased data and business intelligence program governance.

2. Enterprise-wide data integration is a good investment.

3. The promise of semantic technologies.

4. Expanding use of advanced analytics.

5. Narrowing the gap between operational systems and the data warehouse.

6. A new generation drives new priorities in data warehousing and BI.

7. Growing impact and opportunity of complex event processing.

8. Growing importance of integrating and analyzing unstructured/semi-structured data.

9. Social computing and BI.

10. Growing interest in cloud computing for BI.

7 mar. 2010

Buscando feedback de PAT 0.6

Pentaho Analysis Tool (PAT, para los amigos), ya anda por la versión 0.6. Todavía queda un largo camino a los buenos de Tom Barber y Peter Stoellberger, pero la buena noticia es que sigue avanzando, como ya venimos comentando en alguna ocasión.

PAT


Aunque ya andan preparando los desarrollos de lo que será la versión 1.0 (que sería la verdadera puesta de largo), hay mucho que desde la comunidad y desde todos los que quereis/queremos un visor OLAP Open Source podemos hacer.

Nos han comentado de que todos los que podamos probar la aplicación y darles todo tipo de feedback, será muy bienvenido. Para ello, en esta web, contáis con varios recursos para 'acercaros a PAT':

Demo Online de PAT
Video de PAT
Google Code Project Page
Developer Mailing List
End User Mailing List
JIRA Bug Tracker
Access to the latest Trunk build
The PAT Wiki

5 mar. 2010

xcelsius, twitter y el BI Social

Muy interesante lo que nos muestra Timo Elliot, Xcelsius (luego de Business Objects y luego de SAP) tiene una funcionalidad muy interesante, que nos permite hacer el seguimiento de determinados conceptos en twitter, incluirlos en un ppt y actualizarlos dinámicamente.

Muy recomedable!! y útil en presentaciones.

Os pongo un ejemplo, buscando por Pentaho.

Twitter

4 mar. 2010

Global Recession Map

Una interesante y muy visual forma de ver como va la recesión (países que aún siguen con crecimiento negativo), en una comparativa mundial. Ver mapa.

Adivináis cual es la mancha roja más grande en Europa??

Global Recesion Map

3 mar. 2010

Conociendo un poco más de SpagoBIGeo

Ya hemos comentado en alguna ocasión sobre Geobi, en su proceso de integracion con SpagoBI, hoy os acercamos una presentación que nos va a ir aclarando muchos aspectos.

GeoReport

2 mar. 2010

Para conocer Rapid Miner en 5 minutos

Os dejamos el acesso a Videos para conocer brevemente el funcionamiento de Rapid Miner, solución Open Source de Data Mining.

Para todos los interesados en la Minería de Datos,
descargar la versión community.

Ver video tutoriales:

Rapid Miner

1 mar. 2010

10º Foro Business Intelligence en Madrid

Foro BI

Un año más, y ya son unos cuantos, TodoBI es Media Sponsor del Evento más importante que se realiza en España, con una ya la largar tradición. Es en Mayo, por lo que aún tenéis tiempo de pensaroslo.
Nosotros también nos acercaremos al evento, por lo que si alguien quiere aprovechar para avisarnos, reunirse con nosotros y saber algo más de la vertiente 'Open Source' del BI, estaremos encantados.

Descargar folleto del Evento.

Este año, viene con una temática muy interesante. Además, las ponencias todas realizadas por grandes empresas usuarias de BI, prometen ver casos prácticos aplicados a la realidad, más que la preventa de nuevas soluciones.

Agenda:

En su 10º edición da un paso más hacia un enfoque estratégico, global y más interactivo que nunca a través de 5 Interactive Roundtables.

Reunidos en un mismo evento y durante 1 Jornada los mejores expertos en tecnología BI y las experiencias prácticas más pioneras:

AUTORIDAD PORTUARIA DE VALENCIA
AVANTIS
BANESTO
BODEGAS MIGUEL TORRES
CAIXA GALICIA
CAJA ESPAÑA INVERSIONES
CODERE
CONSEJERIA DE SANIDAD DE
LA COMUNIDAD DE MADRID
ENDESA
FRATERNIDAD MUPRESPA
GAS NATURAL-UNION FENOSA
OBRALIA


Live Demos: demostraciones prácticas de tecnología BI aplicadas a casos reales
Area de Exposición con las soluciones BI más novedosas