viernes, 11 de noviembre de 2011

The simpler, the better

Si un día tenéis una conversación con un director de una compañía, especialmente si es dueño de la compañía, podéis hacerle la siguiente pregunta:

- ¿Y usted qué querría poder analizar?

Y si lo que responde es diferente a 'todo' os invito a una cerveza (aportando las pruebas adecuadas).

Vivimos un momento complicado en la analítica de información en las empresas. Antaño el concepto 'silo de información datos' era algo que las best practices del análisis trataban de evitar: datos almacenados, muchas veces olvidados, que sólo ocupan espacio y que se utilizan lo justo en la analítica de negocio, llegando en ocasiones al petabyte (pocas, por el momento).

Un petabyte (8 petabits) es un montón de información. Una burrada. Ante tamaños tan grandes es imposible que con nuestra capacidad humana nos hagamos la idea del a cantidad de información de la que estamos hablando.
Es como cuando se habla del fondo de rescate europeo. La cifra de un billón de euros se dice pronto pero representa 166 billones de pesetas... Que yo hay meses (y seguramente vidas con sus reencarnaciones) que no los cobro.


Actualmente el volumen de información que permiten los sistemas actuales por la reducción de precio hace que la unidad del terabyte sea algo casi doméstico y los sistemas de bases de datos almacenan cada vez más información. ¿Es realmente necesaria tanta información?

En el artículo anterior me preguntaba hacia dónde se dirigiría la próxima revolución en temas analíticos (no dejaba de ser una introducción a este artículo, para preparar el terreno...). Y parece que el próximo paso son los entornos 'In Memory'. SAP Hana o Qlikview son un par de buenos ejemplos (cada uno a su escala) de soluciones de almacenamiento columnar que permiten una reducción importante del volumen de información que se utiliza.

Cuando hablaba, hace tiempo, del procesador cuántico decía que ante una capacidad de proceso ilimitada, las optimizaciones serían las justas porque al final no importaba. La nube, el análisis InMemory y todas las nuevas tecnologías que comienzan a mostrar las orejas parecen predecir un aumento importantísimo de la capacidad de análisis de información, tanto en velocidad como en cantidad. Nos faltaría poder deglutirla sin atragantarnos ni empacharnos con ella.

Hay una serie de premisas que creo que aplican para este caso en concreto y que me gusta repetir de tanto en tanto:
1) The simpler, the better
2) The sooner, the better
y si los puntos 1 y 2 no son posibles:
3) Don't forget the butter

Seguiremos informando.

No hay comentarios:

Publicar un comentario