Cuando se inicia un proyecto de analítica, tradicionalmente pensamos en Business Intelligence (BI), integración de datos con ETL’s y por su puesto el Data Warehouse (DW).
Data Lake aparece como una posible idea posterior cuando por necesidad ya que surgen un mar de datos sin procesar, transitorios que residen en un DW o data marts. A medida que aumenta el volumen de datos y la velocidad, también surgen nuevos desafíos tales como: Incrfemento de costos y esfuerzos, barreras para resolver las necesidades del usuario, eficiencia para el análisis de información, problemas para escalar, cargas de datos de diferentes formatos, democratización de los datos y profundización del conocimiento.
Inicialmente tal vez no se piense en un Data Lake por razones de las habilidades requeridas, tiempo e inversión; aunque como todo, el tiempo va haciendo la tecnología alcanzable.