Cómo generar una transformación en Kettle de una colección de MongoDB

Kettle, ahora conocido como PDI (Pentaho Data Integration) tiene una interfaz intuitiva y gráfica, de arrastrar y soltar. Por su facilidad de manejo para usuarios menos técnicos y una arquitectura probada, escalable y basada en estándares, es cada vez más una gran opción para las empresas de ETL tradicional que buscan herramientas de integración de datos.

A continuación vamos a crear una transformación a partir de una colección de datos de Mongo DB. Para ello vamos a utilizar:

  • MongoDB: Necesitaremos que esté arrancada la base de datos y saber la dirección y el puerto.
  • Kettle: Una versión para usuario conocida como Spoon desde donde descargaremos la información de MongoDB.

1. Insertamos una nueva transformación y arrastramos del menú lateral de Diseño la herramienta MongoDb Input

Pinchando dos veces en ella accedemos a las opciones de MongodB. Necesitaremos tener arrancada la base de datos y conocer la colección, el puerto y la dirección.

En nuestro ejemplo hemos incluido una query en formato json para la extracción de datos que está parametrizada por Provincia. Este parámetro lo utilizaremos en el informe para filtrar la información.

2. Definimos el parámetro de la transformación en ‘Editar’->’Configuración’ e indicamos el valor por defecto:

3. Editamos la información la herramienta Json Input  

Informamos los campos que queremos recuperar para realizar el informe indicando el formato y el nombre.

Unimos los dos iconos y podemos previsualizar el contenido

Con esta transformación sería suficiente para generar el informe. No obstante, realizaremos tres pasos más para conseguir más información de valor.

4. Utilizamos la calculadora   para definir los campos Año, Mes y Día, a partir de la Fecha

5. Realizamos el promedio del campo Resultado con la herramienta agrupar por , que para utilizarla deberemos haber ordenado previamente por la clave.

Ejecutamos la transformación y la guardamos.

Hemos realizado un breve incursión por algunas de las herramientas de Kettle, pero podríamos realizar cálculos más complejos porque ofrece son muchísimas posibilidades.

Para más información:

Spoon User Guide: Transformation Steps

Pentaho:Create a Parameterized Report with MongoDB

Cómo generar una transformación en Kettle de una colección de MongoDB

Un comentario en “Cómo generar una transformación en Kettle de una colección de MongoDB

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s