miércoles, 16 de noviembre de 2011

Some Kind of Monster

Si os gusta el heavy metal en general y Metallica en particular os recomiendo que le echéis un ojo al documental que da nombre a este artículo en el que se explica el proceso creativo de la banda para el disco St. Anger, con sus momentos felices y no tanto entre el fin de la gira de Reload y el primer concierto de la nueva gira, pasando por la selección de Robert Trujillo como nuevo bajista y haciendo las paces con Dave Mustaine.

El documental como tal (premio nacional de poesía) no tiene nada que ver con la informática salvo en el fondo: un entorno informático no deja de ser algún tipo de monstruo. Me explicaré con mis habituales parábolas (Abel educa y divierte):

- ¿Sí, dígame?
- ¿Informática? Tengo una duda. Hay un dato que en mi cuadro de mandos no me cuadra con lo que estoy sacando del SAP.
- ¿De cuándo es el dato de SAP?
- De esta mañana
- Entonces no estará en el cuadro de mandos hasta mañana o pasado.
- Pero eso no puede ser...
- Poder sí que puede... Otra cosa es que debiera ser así o no.

Esta situación se repite con más frecuencia de la que sería deseable y todo por la complejidad de los mecanismos que llevan ese dato desde su origen al punto en que el usuario acaba 'disfrutando' de él:
- Salida: Terminal punto de venta
- Paso 1: Cargar en ERP
- Paso 1b: reprocesar ERP (¡opcional!)

- Paso 2: Extraer del ERP mediante extractor a fichero plano
- Paso 3: Cargar en ODS mediante proceso ETL estándar
- Paso 4: Cargar en DWH mediante proceso ETL complejo (integración)
- Paso 4b: Cuadrar (¡recomendable!)  y si posible: automáticamente
- Paso 5: Cargar en Datamart específico mediante proceso ETL
- Paso 6: Generar cubo específico de análisis
- Paso 6b: Actualizar la metadata del sistema de reporting/cuadro de mando
- Paso 6c: Recargar caché/base de datos específica/módulo especial chachiguay del sistema de reporting
- Paso 7: Obtener el dato mediante el sistema de reporting/cuadro de mando

Con suerte, el ticket de compra del pantalón de turno acabará en el maremagnum de datos del cuadro de mandos al día siguiente (tal vez incluso a primera hora) pero tras pasar por varios sistemas, varias transformaciones y multitud de cálculos, tiempo de proceso, posibilidad de descuadres, etc.
Vamos, que a veces obtener el dato correcto al final del proceso parece cosa de suerte teniendo en cuenta la cantidad de transformaciones que experimenta (que ni el Dr. Jekyll en sus malos tiempos). Y todo porque, como decía antes, los sistemas decisionales en concreto y la informática de gestión en general se han convertido en alguna clase de monstruo que coarta (o puede hacerlo) el crecimiento y la escalabilidad de los sistemas y de la compañía por la terrible complejidad de trabajar con N entornos, M tecnologías y Ñ interfícies.

Es en este momento cuando:
- Informática, ¿dígame?
- Oye, que necesitaría que se incluyera en el cuadro de mando un nuevo indicador de SAP.
- ¡Uf! Pues eso va a tardar, hay que tocar 4 ETLs mínimo, recuadrar todos los sistemas, hacer pruebas... Por lo menos hasta dentro de un par de semanas no lo vas a tener.
- Pues es una pena, porque es el indicador de prima por productividad para este año...
- Nada, hombre, eso lo tienes mañana casi... Ya me esforzaré...

Si contamos con que el 80% del tiempo de un proyecto (mínimo) es por razones relacionadas con las ETL, ¿no puede ser que nos estemos equivocando mucho (¡muchísimo!) en cómo trabajamos los datos? ¿Sería posible realizar una organización escalable con una estructura fija como el modelo estrella recursiva que hiciera innecesario tener que meter mano a un DWH?
Las herramientas de BI han simplificado (en cierta manera) el acceso a la información, pero la elaboración y preparación de esta información, a pesar de que hay ETLs excelentes, sigue siendo el talón de Aquiles de cualquier proyecto, pudiendo llevarlo al traste. ¿No opináis que debería ser mucho más simple?

No hay comentarios:

Publicar un comentario