Os sistemas de Data Warehouse são tradicionalmente
suportados por modelos multidimensionais predefinidos,
tendo o intuito de prover suporte a aplicações de Business
Intelligence. A resposta às novas necessidades é a
utilização de memória extensiva, distribuição de dados e
paralelização de processamento, que, de uma forma ou de
outra, estão incluídos no Apache Hadoop, Apache Spark,
bases de dados NoSQL e tecnologias complementares a
estas.
Uma característica importante do Apache Spark é