miércoles, 20 de octubre de 2010

¿ETL-gonomía?

Aunque cada vez es más conocido, un porcentaje muy grande de los clientes y de los desarrolladores de proyectos no asocian un proyecto de análisis de datos a la complejidad del tratamiento de los mismos que hace que más del 80% del tiempo de desarrollo del proyecto deba dedicarse a la labor de generar y tratar los mismos.

El caso es que muchas veces cuando sí se asocia y se sabe, uno se encuentra con una señora herramienta ETL y en otros casos con una infantil etl. La verdad es que en algunos casos las etl son mastodónticas y multimuchascosas y permiten hacer lo que no está escrito (con más o menos dificultad). En otros casos, son auténticos quebraderos de cabeza que impiden cargar un simple fichero de texto sin tener que pasar por 25 pasos y varios servicios o aplicaciones haciendo bueno al importador de datos de Access.

En el último caso, que suele ser frecuente cuando uno no tiene bien definido todos los procesos de carga, es cuando se hace más patente la absoluta falta de ergonomía de algunas ETL.
Y en este caso quiero hacer especial hincapié en las ETL de Oracle (podría ser extensivo a casi cualquier producto de Oracle, no obstante): ODI y OWHB.

No quiero entrar en su funcionalidad (hacen lo que deben) pero sí en puntualizar algunas cosas:
- El ¿mal? uso de Java como interfaz que hace de cada click un drama (Kettle también usa Java y es mucho más ágil)
- La absoluta falta de la opción de deshacer
- El aspecto tan moderno (apreciación personal, pero es que me recuerda a las aplicaciones de windows 3.1 de finales de los 80).
- La filosofía de desarrollo de ODI, muy lejos de lo que es la filosofía estándar de una ETL.

De estas cosas la que más molesta me resulta es la primera. Entiendo que Oracle potencie el uso de Java al ser ahora su propietario tras la adquisición de Sun, pero no iría mal un planteamiento diferente en lo que a implementación se refiere.

Sun no podía haber elegido un mejor nombre para su entorno de programación que Java: cada vez que ejecutas algo puedes ir a tomarte un café.

2 comentarios:

  1. Hola, vengo rebotado de un tweet de bifacil :)

    Como usuario directo de las herramientas que mencionas, tengo que darte la razón pero con un pequeño "pero".

    Es cierto que en versiones anteriores de DWHB (y de otras dev tools de oracle) las interfaces java eran desesperantes. Sin embargo, en las últimas versiones (versiones 10.2 y 11g) los problemas de interfaz se han solucionado enormemente y ya no es un suplicio trabajar con ellas. En este aspecto creo que Oracle está haciendo los deberes.

    Sobre el tema de ODI, ciertamente se solapa en algunas funciones con DWHB. Es el problema de ir comprando todas las empresas que te vienen al pelo. Pero sus inicios ODI estaba pensado para ser una herramienta de movimiento masivo de datos entre origenes heterogeneos, mientras que DWHB era su ETL "principal". Ahora mismo con la salida de ODI11g da la impresión que ambos productos pueden dar funcionalidades muy similares.

    Si este post lo hubiera leido hace un par de años te daría la razón 100%. Ahora mismo con las últimas herramientas, la cosa va mejorando.

    Un saludo y enhorabuena por el blog, es muy interesante :)

    ResponderEliminar
  2. Según el roadmap de Oracle, ODI acabará sustituyendo a OWHB.
    Aunque la interfaz de ODI está a años luz de la de OWHB no puede negarse que no es la herramienta más ergonómica del mundo y que en general las herramientas de Oracle no tienen nada que ver a nivel de usabilidad (desde el punto de vista de look&feel de usuario) con el gran experto del tema: Microsoft.

    El día que una ETL tenga la ergonomía y usabilidad de una herramienta ofimática se habrá dado un paso importantísimo en el desarrollo de proyectos y en la reusabilidad y entendimiento de los tratamientos.

    Mientras tanto, lamentablemente, aunque Oracle y otras compañías vayan haciendo sus deberes aún queda mucho para estar en una situación de comodidad. Y mucho más lamentable es que a pesar de estos esfuerzos haya clientes que se empecinen en mantener versiones del pleistoceno que no contemplan estas pequeñas pero importantes mejoras.

    Respecto al blog, muchas gracias. Abrimos 24x7 para decir verdades tontas y tonterías ciertas :-)

    ResponderEliminar