Questões de Concurso
Sobre data mining em banco de dados
Foram encontradas 451 questões
No que se refere à qualidade e visualização de dados, julgue o item a seguir.
Para a identificação de outliers, deve-se calcular o intervalo
interquartil (IQR) e identificar dados que estão a mais de 1,5
vezes o IQR abaixo do primeiro quartil ou acima do terceiro
quartil.
A respeito de análise exploratória de dados, julgue o item a seguir.
Um dado anômalo, ou outlier, é um valor que se destaca
significativamente dos demais em um conjunto de dados e
pode ser identificado visualmente por meio do gráfico boxplot.
A respeito de análise exploratória de dados, julgue o item a seguir.
Na análise exploratória de dados, é comum categorizar os
valores não numéricos como variáveis qualitativas, que
podem ser subdivididas em discreta, como raça e cor, e em
ordinal, como tamanho de uma roupa ou classe social.
No que se refere a deep learning e mineração de dados, julgue o item subsecutivo.
A mineração de dados é comumente classificada por sua
capacidade de realizar determinadas tarefas, entre as quais
está a estimação, que, embora similar à classificação, é usada
quando o registro é identificado por um valor numérico e não
um categórico.
Considere as seguintes afirmações sobre ETL (Extrac, Transform e Load), OLAP (Online Analytical Processing) e Data Mining:
I – Em sistemas data warehouse, a aplicação é mais voltada para inserir e atualizar dados, devido ao carregamento de dados com o ETL. Já em sistemas transacionais, utilizam-se mais consultas, conforme site https://www.oracle.com/br/database/what-is-a-data-warehouse/;
II – OLAP são softwares que permitem a tomada de decisões e inteligência de negócios e agregam recursos de busca de dados, armazenagem e gerência, conforme site: https://cetax.com.br/o-que-eolap/.
III – ETL não possui suporte a SQL (structured query language), pois utiliza somente DSL (decision support language).
Assinale a alternativa CORRETA:
Utilize a figura a seguir (Fig3), que representa uma sequência de comandos em SQL, para resolver as questões de número 54 e 55.
Fig3
create table cliente
{
seq VARCHAR2(6) not null,
nome VARCHAR2(50) not null,
cpf VARÇHAR2(11) not null,
data nasc date,
dependentes numeric(2),
estcivil VARCHAR2(1)
);
arter table cliente
ADD CONSTRAINT cliente pk PRIMARY KEY (cpf)
ADD CONSTRAINT seq un unique (seq) enable
ADD CONSTRAIKT est ck check (estcivil in ('C','S','D','V')) enable
ADD CONSTRAINT cpf ch check (REGEXP LIKE(cpf, '^[[digit: ]]{11}$')) enable;
Como se chama o processo de explorar grandes quantidades de dados à procura de anomalias, padrões e correlações consistentes, tais como regras de associação ou sequências temporais, para detectar relacionamentos sistemáticos entre variáveis, detectando assim novos subconjuntos de dados?
No que se refere a modelagem dimensional, mineração de dados e big data, julgue o item subsequente.
No modelo CRISP-DM, a fase de preparação dos dados é caracterizada por atividades como análise da qualidade dos dados,
exploração dos dados, geração dos primeiros insights e formulação de hipóteses.
( ) Em um sistema BigData, o pipeline de dados implementa as etapas necessárias para mover dados de sistemas de origem, transformar esses dados com base nos requisitos e armazenar os dados em um sistema de destino, incluindo todos os processos necessários para transformar dados brutos em dados preparados que os usuários podem consumir.
( ) Dentre os métodos de manipulação de valores ausentes, em processamento massivo e paralelo, consta a normalização numérica, que se refere ao processo de ajustar os dados para que estejam em uma escala comparável, geralmente entre 0 e 1.
( ) A demanda crescente por medidas de criptografia ponta a ponta (da produção ao backup) tornam menos eficazes e relevantes tecnologias legadas, como a deduplicação de dados (data deduplication), que busca ajudar a otimizar o armazenamento e melhorar o desempenho de um sistema ao estabelecer processo de identificar e eliminar dados duplicados em um sistema.
As afirmativas são, respectivamente,
Avalie se os dados ausentes são categorizados como
I. MCAR. Valores ausentes completamente aleatórios.
II. Valores ausentes aleatórios.
III. MICE. Valores ausentes usando imputação múltipla usando equações encadeadas.
Está correto o que se apresenta em
Julgue o item a seguir que tratam de extração e representação de conhecimento.
Em mineração de dados, interpretação e explanação consiste
em filtrar o conjunto de dados por meio de mecanismo que
varia de acordo com a técnica de mineração utilizada.
Considerando processos de análise e mineração de dados, julgue o item subsecutivo.
No contexto de mineração de dados, o atributo da veracidade
está associado ao grau de confiabilidade dos dados utilizados
na solução.
Considerando processos de análise e mineração de dados, julgue o item subsecutivo.
Em data mining, um mesmo processo de análise de dados
pode utilizar bancos de dados relacionais ou NoSQL, mas
não simultaneamente.
Considerando processos de análise e mineração de dados, julgue o item subsecutivo.
O processo de análise por inferência busca o conhecimento
dos dados para obtenção de resultados consolidados.
Considerando processos de análise e mineração de dados, julgue o item subsecutivo.
Em data mining, a técnica de associação é uma função que
determina o coeficiente de afinidade entre certos eventos.
Considerando processos de análise e mineração de dados, julgue o item subsecutivo.
É na fase de mineração do data mining que são definidos os metadados dos dados manipulados.
Considerando processos de análise e mineração de dados, julgue o item subsecutivo.
A técnica da árvore de decisão utiliza, entre outras, a
abordagem de predição, na qual grupos diferentes são
identificados de acordo com características em comum.