Questões de Concurso
Foram encontradas 532 questões
Resolva questões gratuitamente!
Junte-se a mais de 4 milhões de concurseiros!
A mineração de dados (Data Mining) envolve um conjunto de algoritmos e ferramentas que são utilizados para a exploração de dados.
Assinale o algoritmo/método usado na extração de regras de associação.
No contexto dos processos ETL (Extract, Transform & Load), analise as afirmativas a seguir.
I. A Stage Area é comumente usada para a limpeza, consolidação, agregação, alinhamento e outras funções aplicadas aos dados oriundos de múltiplas fontes.
II. Além de bancos de dados de produção, arquivos avulsos formatados como por exemplo CSV, planilhas, XML, JSON são frequentemente usados no processo de carga (load).
III. Na Stage Area são criados bancos de dados próprios com dados temporários apenas, cuja finalidade é aproveitar as facilidades de acesso e manipulação para as tarefas de transformação dos dados.
Está correto o que se afirma em
Leia o fragmento a seguir.
“CRISP-DM é um modelo de referência não proprietário, neutro, documentado e disponível na Internet, sendo amplamente utilizado para descrever o ciclo de vida de projetos de Ciência de Dados. O modelo é composto por seis fases: 1. entendimento do negócio; 2. _____; 3. _____; 4. Modelagem; 5. _____ ; e 6. implantação”.
Assinale a opção cujos itens completam corretamente as lacunas do fragmento acima, na ordem apresentada.
Julgue o próximo item, a respeito de ETL, ELT e data lake.
O processo ETL (extrair, transformar e carregar) permite
analisar grandes volumes de dados de forma rápida; para
isso, é necessário duplicar o espaço em disco e triplicar o
tempo no carregamento e na transformação de dados em
relação ao ELT (extrair, carregar e transformar), que
compacta os dados no carregamento.
No início de um processo de descoberta de conhecimento em bases de dados (KDD), o CRISP-DM recomenda, em relação ao levantamento do hardware existente, que o processo de KDD seja realizado em plataforma com arquitetura não expansível, que forneça suporte e acesso somente à base de dados homogênea.