Questões de Banco de Dados - Data Mining para Concurso
Foram encontradas 409 questões
− Qual formato de data será utilizado: dd/mm/aaaa ou mm/dd/aaaa?
− Os dados advindos das diversas fontes, relativos a um mesmo conteúdo, são compatíveis entre si?
− Os campos binários serão formatados com True e False ou terão que ser convertidos para 1 e 0?
− Após as análises descritivas, a média, a mediana, a moda e a quantidade dos dados estão de acordo com as categorias definidas?
Com base nas questões apresentadas, a equipe está trabalhando na etapa do CRISP-DM denominada
“A tarefa de detecção de anomalias é um caso particular de problema de _____, onde a quantidade de objetos da classe alvo (anomalia) é muito inferior à quantidade de objetos da classe normal e, adicionalmente, o custo da não detecção de uma anomalia (_____) é normalmente muito maior do que identificar um objeto normal como uma anomalia (_____)”
Assinale a opção cujos itens completam corretamente as lacunas do fragmento acima, na ordem apresentada.
( ) Consiste em fixar k centroides de modo quadrático, sendo um para cada novo cluster.
( ) Associa cada indivíduo ao centroide do seu vizinho, obtido pelo cálculo da minimização da soma quadrática das distâncias entre os dados e os centroides mais próximos.
( ) Recalcula os centroides com base nos indivíduos classificados.
As afirmativas são, na ordem apresentada, respectivamente,