Questões de Banco de Dados - Data Mining para Concurso - Página 6

Q2213504

Ano: 2012 Banca: FUNDEP (Gestão de Concursos) Órgão: MPE-MG Prova: FUNDEP (Gestão de Concursos) - 2012 - MPE-MG - Analista do MP - Tecnologia da Informacao - Administração de Banco de Dados |

Q2213504 Banco de Dados

Como é conhecido o padrão de data mining em que o sistema irá aprender com alguns exemplos antes de partir para uma efetiva identificação de tipos de dados que sejam desconhecidos a partir dos exemplos apresentados?

A

Treinamento a posteriori

B

Treinamento dedutivo

C

Treinamento online

D

Treinamento supervisionado

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2188060

Ano: 2023 Banca: IF-MT Órgão: IF-MT Prova: IF-MT - 2023 - IF-MT - Professor do Ensino Básico, Técnico e Tecnológico - Informática |

Q2188060 Banco de Dados

Sobre as etapas do processo de descoberta de conhecimento e mineração de dados (KDD, Knowledge Discovery and Data Mining), numere a coluna da direita de acordo com a coluna da esquerda:
1. Seleção de dados 2. Limpeza de dados 3.Mineração de dados 4. Avaliação
( ) São aplicados algoritmos para extração de características dos dados.
( ) O subconjunto objetivado dos dados e os atributos de interesse são identificados examinando-se o conjunto de dados bruto inteiro.
( ) Os padrões são apresentados para os usuários em uma forma inteligível.
( ) Ruído e exceções são removidos, valores de campo são transformados em unidades comuns e alguns campos são criados pela combinação de campos já existentes para facilitar a análise. Normalmente, os dados são colocados em um formato relacional, e várias tabelas podem ser combinadas em uma etapa de desnormalização.

Assinale a alternativa que apresenta a numeração CORRETA da coluna da direita, de cima para baixo, conforme Raghu e Gehrke (2011, p. 739):

A

3 – 1 – 4 – 2

B

1 – 4 – 2 – 3

C

1 – 2 – 3 – 4

D

3 – 2 – 4 – 1

E

1 – 2 – 4 – 3

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2183344

Ano: 2023 Banca: FGV Órgão: TJ-RN Prova: FGV - 2023 - TJ-RN - Analista Judiciário - Tecnologia de Informação – Análise de Sistemas |

Q2183344 Banco de Dados

A analista Carla recebeu a tarefa de implementar uma solução algorítmica para classificar os processos arquivados no TJRN entre aqueles que foram ganhos e aqueles que foram perdidos. Na primeira abordagem, Carla se baseou no algoritmo de machine learning que, aplicado à classificação binária, divide os dados de entrada em duas regiões separadas por uma reta. Ao fim do algoritmo, a distância da reta para o dado mais próximo de cada região é a mesma e a maior possível.
Sendo assim, na primeira abordagem, Carla utilizou como base o algoritmo de machine learning:

A

K-Médias;

B

Regressão Linear;

C

Regressão Logística;

D

K-Vizinhos Mais Próximos;

E

Máquina de Vetores de Suporte.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2172386

Ano: 2023 Banca: FUNDATEC Órgão: PROCERGS Prova: FUNDATEC - 2023 - PROCERGS - ANC - Analista em Computação - Ênfase em Ciências de Dados |

Q2172386 Banco de Dados

Assinale a alternativa correta sobre os critérios de seleção de atributos aplicáveis na construção de árvores de decisão.

A

Ganho de informação normaliza o critério de ganho de informação e deve ser usado para selecionar atributos que obtiveram um ganho de informação médio.

B

Índice Gini usa um critério baseado em impureza para analisar as diferenças entre as distribuições de probabilidade dos valores dos atributos da classe (rótulos).

C

DKM é um critério baseado no cálculo do ângulo entre vetores que representam a distribuição de classes nas partições geradas.

D

Raio de ganho usa a medida de entropia como meio para análise do grau de impureza das partições geradas a partir da análise dos valores de um atributo descritivo.

E

ORT é critério baseado em impureza para atributos de classes binárias.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2172384

Ano: 2023 Banca: FUNDATEC Órgão: PROCERGS Prova: FUNDATEC - 2023 - PROCERGS - ANC - Analista em Computação - Ênfase em Ciências de Dados |

Q2172384 Banco de Dados

__________ é um método de classificação binária que traça um hiperplano ótimo que maximiza a margem de separação entre duas classes de dados. A etapa principal do algoritmo é descobrir os vetores que são as instâncias equidistantes do hiperplano.
Assinale a alternativa que preenche corretamente a lacuna do trecho acima.

A

Random Forest

B

Support Vector Machine (SVM)

C

k-Nearest Neighbors

D

Naïve Bayes

E

k-Means

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2172383

Ano: 2023 Banca: FUNDATEC Órgão: PROCERGS Prova: FUNDATEC - 2023 - PROCERGS - ANC - Analista em Computação - Ênfase em Ciências de Dados |

Q2172383 Banco de Dados

__________ é uma classe de métodos ensemble que utiliza classificadores de árvore de decisão. É uma combinação de preditores de árvores tal que cada árvore depende dos valores de um vetor aleatório amostrado independentemente e com a mesma distribuição para todas as árvores.
Assinale a alternativa que preenche corretamente a lacuna do trecho acima.

A

Árvore de decisão

B

Random Forest

C

k-Nearest Neighbors

D

Regressão logística

E

Support Vector Machine (SVM)

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2172377

Ano: 2023 Banca: FUNDATEC Órgão: PROCERGS Prova: FUNDATEC - 2023 - PROCERGS - ANC - Analista em Computação - Ênfase em Ciências de Dados |

Q2172377 Banco de Dados

Analise as assertivas abaixo sobre o método de agrupamento k-means:
I. Dada uma coleção de objetos, cada um com n atributos, k-means é um método que, para I - um valor escolhido de k, identifica k grupos de objetos com base na proximidade dos objetos com relação ao centroide do grupo. O centro é determinado como a média do vetor n-dimensional de atributos de cada grupo.
II. Por ser um método supervisionado, o K-means ajuda a excluir a subjetividade das análises.
III. K-means é um método para definir agrupamentos. Uma vez que os agrupamentos e os seus centroides são identificados, é fácil classificar novos objetivos para um cluster baseado na distância do objeto do centroide mais próximo.
Quais estão corretas?

A

Apenas II.

B

Apenas I e II.

C

Apenas I e III.

D

Apenas II e III.

E

I, II e III.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2172372

Ano: 2023 Banca: FUNDATEC Órgão: PROCERGS Prova: FUNDATEC - 2023 - PROCERGS - ANC - Analista em Computação - Ênfase em Ciências de Dados |

Q2172372 Banco de Dados

Relacione a Coluna 1 à Coluna 2, associando as categorias de aprendizado de máquina às suas características.
Coluna 1 1. Aprendizado Supervisionado. 2. Aprendizado Não Supervisionado. 3. Aprendizado Profundo.
Coluna 2 ( ) O algoritmo recebe um conjunto de dados rotulados e aprende comparando a saída do modelo com a saída esperada, reajustando seus parâmetros até chegar em um limiar aceitável e pré-determinado a priori.
( ) Os algoritmos buscam encontrar padrões ou estruturas em conjuntos de dados não rotulados, por exemplo, gerando agrupamentos de dados.
( ) Conjunto de algoritmos que modelam abstrações de alto nível de dados usando grafos com várias camadas de processamento, compostas de várias transformações lineares e não lineares.
( ) Processo de aprendizado baseado em redes neurais com várias camadas (em geral, mais de cinco camadas): entrada, saída e oculta.
A ordem correta de preenchimento dos parênteses, de cima para baixo, é:

A

3 – 1 – 2 – 2.

B

1 – 2 – 3 – 3.

C

2 – 3 – 1 – 2.

D

2 – 1 – 3 – 1.

E

3 – 2 – 2 – 1.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2172364

Ano: 2023 Banca: FUNDATEC Órgão: PROCERGS Prova: FUNDATEC - 2023 - PROCERGS - ANC - Analista em Computação - Ênfase em Ciências de Dados |

Q2172364 Banco de Dados

Qual é a etapa de modelagem da metodologia CRISP-DM na qual são tratados os valores nulos e pode ser necessário fazer fusão com outros dados?

A

Entendimento do Negócio.

B

Preparação de Dados.

C

Modelagem.

D

Avaliação.

E

Implementação.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2133419

Ano: 2023 Banca: CESPE / CEBRASPE Órgão: CNMP Prova: CESPE / CEBRASPE - 2023 - CNMP - Analista do CNMP – Área: Tecnologia da Informação e Comunicação - Especialidade: Suporte e Infraestrutura |

Q2133419 Banco de Dados

A respeito de data warehouse e data mining, julgue o próximo item.

Fatos, dimensões e medidas são elementos essenciais de um data warehouse.

Certo

Errado

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2133418

Ano: 2023 Banca: CESPE / CEBRASPE Órgão: CNMP Prova: CESPE / CEBRASPE - 2023 - CNMP - Analista do CNMP – Área: Tecnologia da Informação e Comunicação - Especialidade: Suporte e Infraestrutura |

Q2133418 Banco de Dados

A respeito de data warehouse e data mining, julgue o próximo item.

O data mining é um processo usado para extrair e analisar informações que revelam padrões ou tendências estratégicas do negócio.

Certo

Errado

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2130906

Ano: 2013 Banca: CESPE / CEBRASPE Órgão: MC Prova: CESPE / CEBRASPE - 2013 - MC - Atividade de Complexidade Gerencial - Tecnologia da Informação |

Q2130906 Banco de Dados

Com relação a soluções de suporte à decisão, julgue o item subsecutivo.

Data mining utiliza diversos tipos de padrões e técnicas para descobrir o conhecimento em base de dados. Eles são provenientes, automaticamente, do banco de dados e não há interação manual na descoberta de novos tipos de padrões.

Certo

Errado

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2128641

Ano: 2023 Banca: CESGRANRIO Órgão: Banco do Brasil Prova: CESGRANRIO - 2023 - Banco do Brasil - Agente de Tecnologia - Microrregião 158 - TI |

Q2128641 Banco de Dados

Sabendo que existe, na organização em que trabalha, uma base de dados formada por uma grande tabela que contém apenas o id do cliente e colunas do tipo booleano indicando se um cliente possuía ou já tinha possuído cada produto da organização, um funcionário de TI resolveu dividir os clientes em grupos apenas com base nessa informação, utilizando aprendizado de máquina.
Para essa tarefa, o funcionário de TI deve utilizar o aprendizado de máquina

A

independente

B

não supervisionado

C

por recompensa

D

por reforço

E

supervisionado

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2078035

Ano: 2023 Banca: Quadrix Órgão: CREF - 3ª Região (SC) Prova: Quadrix - 2023 - CREF - 3ª Região (SC) - Analista de Tecnologia da Informação |

Q2078035 Banco de Dados

No que diz respeito ao modelo de referência CRISP-DM (Cross Industry Standard Process for Data Mining), julgue o item.

No ciclo do CRISP-DM, a fase de implantação é a mais simples (jamais será um processo complexo), pois se resume à execução de scripts.

Certo

Errado

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2078034

Ano: 2023 Banca: Quadrix Órgão: CREF - 3ª Região (SC) Prova: Quadrix - 2023 - CREF - 3ª Região (SC) - Analista de Tecnologia da Informação |

Q2078034 Banco de Dados

No que diz respeito ao modelo de referência CRISP-DM (Cross Industry Standard Process for Data Mining), julgue o item.

O entendimento do negócio é a fase do ciclo do CRISP-DM que exige mais tempo em mineração de dados, pois estima-se que essa etapa, geralmente, leve entre 50 e 70% do tempo e do esforço de um projeto.

Certo

Errado

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2078033

Ano: 2023 Banca: Quadrix Órgão: CREF - 3ª Região (SC) Prova: Quadrix - 2023 - CREF - 3ª Região (SC) - Analista de Tecnologia da Informação |

Q2078033 Banco de Dados

No que diz respeito ao modelo de referência CRISP-DM (Cross Industry Standard Process for Data Mining), julgue o item.

Modelagem e avaliação são algumas das fases do ciclo do CRISP-DM.

Certo

Errado

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2078032

Ano: 2023 Banca: Quadrix Órgão: CREF - 3ª Região (SC) Prova: Quadrix - 2023 - CREF - 3ª Região (SC) - Analista de Tecnologia da Informação |

Q2078032 Banco de Dados

No que diz respeito ao modelo de referência CRISP-DM (Cross Industry Standard Process for Data Mining), julgue o item.

A única desvantagem que impede o uso em larga escala do CRISP-DM é o seu alto custo, uma vez que os usuários somente podem utilizá-lo após a aquisição da licença.

Certo

Errado

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2078031

Ano: 2023 Banca: Quadrix Órgão: CREF - 3ª Região (SC) Prova: Quadrix - 2023 - CREF - 3ª Região (SC) - Analista de Tecnologia da Informação |

Q2078031 Banco de Dados

No que diz respeito ao modelo de referência CRISP-DM (Cross Industry Standard Process for Data Mining), julgue o item.

O CRISP-DM é uma metodologia abrangente de mineração de dados e um modelo de processo que fornece, para os usuários de data mining (DM), um modelo completo para a realização de um projeto de DM.

Certo

Errado

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2066826

Ano: 2023 Banca: FGV Órgão: CGE-SC Prova: FGV - 2023 - CGE-SC - Auditor do Estado - Ciências da Computação - Tarde (Conhecimentos Específicos) |

Q2066826 Banco de Dados

Sobre detecção de anomalias, analise as afirmativas a seguir.
I. São exemplos de detecção de anomalias: detecção de fraude, detecção de intrusão, monitoramento de sistemas de saúde, qualidade de um produto. II. São métodos que conseguem lidar com detecção de anomalias: algoritmos baseados em densidade, análise de agrupamento, redes neurais recorrentes, redes bayesianas e modelos de Markov escondidos. III. A distribuição normal é a distribuição mais comum dos dados considerados dentro de uma normalidade, porém, podemos obter normalidade também por meio de outros tipos de distribuição como a distribuição de Bernoulli, distribuição uniforme, distribuição binomial e distribuição de Minkowski. IV. A métrica de avaliação desses métodos pode ajudar na identificação de dados fora do padrão. Portanto, as métricas de precisão, sensibilidade e medida-F1 são exemplos de métricas utilizadas para detecção de anomalias.
Está correto o que se afirma em

A

I e II, apenas.

B

II e III, apenas.

C

II, III e II, apenas.

D

I, II e IV, apenas.

E

I, III e IV, apenas.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2020855

Ano: 2022 Banca: CESPE / CEBRASPE Órgão: BNB Prova: CESPE / CEBRASPE - 2022 - BNB - Analista de Sistemas - Desenvolvimento de Sistemas |

Q2020855 Banco de Dados

Julgue o item a seguir, a respeito do conceito de data lake.
O termo data lake é usado para se referir a uma arquitetura em que os dados são armazenados em vários sistemas de armazenamento de dados e em diferentes formatos, inclusive em sistemas de arquivos, mas podem ser consultados em um único sistema.

Certo

Errado

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

A HORA DE VIRAR O JOGO É AGORA

A HORA DE VIRAR O JOGO É AGORA

Questões de Concurso Sobre data mining em banco de dados

Foram encontradas 451 questões