Questões de Concurso
Foram encontradas 598 questões
Resolva questões gratuitamente!
Junte-se a mais de 4 milhões de concurseiros!
Acerca de mineração de dados (data mining), julgue o item a seguir.
No procedimento de limpeza de dados (data cleaning),
identifica-se ausência de valores quando um conjunto de
dados apresenta apenas dados agregados em relação a
certo atributo.
Considere-se que uma empresa de comércio eletrônico deseje armazenar todos os dados relacionados às interações dos clientes em seu site — registros de visitas, cliques, compras, avaliações, comentários, entre outros. Nessa situação, se a empresa decidir não estruturar e organizar esses dados antecipadamente, será melhor armazenar esses dados em uma solução data lake do que em um banco relacional.
Spark é uma arquitetura de sistema operacional para trabalhar com dados organizados de forma hierárquica, utilizando-se o módulo Spark SQL, que permite consultar arquivos pelo seu conteúdo.
Julgue o item a seguir, relativos ao Hadoop e ao Spark.
Hadoop é uma plataforma de código aberto que oferece uma
solução tecnológica confiável e escalável para
armazenamento e análise de grande quantidade de dados.