Questões de Concurso Comentadas sobre data mining em banco de dados

Foram encontradas 416 questões

Q2228311 Banco de Dados

Julgue o item a seguir, a respeito de inteligência artificial (IA) e machine learning. 


K-means é um algoritmo de aprendizado não supervisionado, em que se calcula a distância entre os objetos da base e cada um dos centroides; em que se atribui cada objeto ao centroide mais próximo; e em que se classifica cada item para sua média mais próxima. 

Alternativas
Q2226549 Banco de Dados
Aprendizado de máquina é um subcampo da inteligência artificial que consiste no treinamento de modelos computacionais para que possam reconhecer padrões e, a partir de um conjunto de dados de entrada, prever o valor de uma variável de saída. Em relação ao aprendizado de máquina, julgue o item a seguir.  
A medida de confiança de uma regra de associação é calculada pela frequência com que tal regra aparece em transações individuais na base de dados transacional.

Alternativas
Q2226081 Banco de Dados
Quanto a Noções de Data Mining e Business Intelligence (BI), analise as assertivas abaixo e assinale a alternativa correta.
I. Data Mining faz a varredura de uma pequena quantidade de dados de cada vez. II. Business Intelligence atua na parte física de infraestrutura. III. Data Mining também é conhecido como mineração de dados. IV. Business Intelligence passou a ser tratado como uma aplicação de estratégia integrada.
Alternativas
Q2222876 Banco de Dados
Conhecido também como mineração de dados, sua função principal é a varredura de grande quantidade de dados à procura de padrões e detecção de relacionamentos entre informações, gerando novos subgrupos de dados. Usado comumente em grandes bancos de dados, pode-se considerar que é como um agregador e organizador de dados. Trata-se do conceito de:
Alternativas
Q2213504 Banco de Dados
Como é conhecido o padrão de data mining em que o sistema irá aprender com alguns exemplos antes de partir para uma efetiva identificação de tipos de dados que sejam desconhecidos a partir dos exemplos apresentados? 
Alternativas
Q2188060 Banco de Dados
Sobre as etapas do processo de descoberta de conhecimento e mineração de dados (KDD, Knowledge Discovery and Data Mining), numere a coluna da direita de acordo com a coluna da esquerda:
1. Seleção de dados  2. Limpeza de dados  3.Mineração de dados 4. Avaliação
( ) São aplicados algoritmos para extração de características dos dados.
( ) O subconjunto objetivado dos dados e os atributos de interesse são identificados examinando-se o conjunto de dados bruto inteiro.
( ) Os padrões são apresentados para os usuários em uma forma inteligível.
( ) Ruído e exceções são removidos, valores de campo são transformados em unidades comuns e alguns campos são criados pela combinação de campos já existentes para facilitar a análise. Normalmente, os dados são colocados em um formato relacional, e várias tabelas podem ser combinadas em uma etapa de desnormalização. 

Assinale a alternativa que apresenta a numeração CORRETA da coluna da direita, de cima para baixo, conforme Raghu e Gehrke (2011, p. 739):
Alternativas
Q2183344 Banco de Dados
A analista Carla recebeu a tarefa de implementar uma solução algorítmica para classificar os processos arquivados no TJRN entre aqueles que foram ganhos e aqueles que foram perdidos. Na primeira abordagem, Carla se baseou no algoritmo de machine learning que, aplicado à classificação binária, divide os dados de entrada em duas regiões separadas por uma reta. Ao fim do algoritmo, a distância da reta para o dado mais próximo de cada região é a mesma e a maior possível.
Sendo assim, na primeira abordagem, Carla utilizou como base o algoritmo de machine learning:
Alternativas
Q2172386 Banco de Dados
Assinale a alternativa correta sobre os critérios de seleção de atributos aplicáveis na construção de árvores de decisão. 
Alternativas
Q2172384 Banco de Dados
__________ é um método de classificação binária que traça um hiperplano ótimo que maximiza a margem de separação entre duas classes de dados. A etapa principal do algoritmo é descobrir os vetores que são as instâncias equidistantes do hiperplano.
Assinale a alternativa que preenche corretamente a lacuna do trecho acima.
Alternativas
Q2172383 Banco de Dados
__________ é uma classe de métodos ensemble que utiliza classificadores de árvore de decisão. É uma combinação de preditores de árvores tal que cada árvore depende dos valores de um vetor aleatório amostrado independentemente e com a mesma distribuição para todas as árvores.
Assinale a alternativa que preenche corretamente a lacuna do trecho acima.
Alternativas
Q2172377 Banco de Dados
Analise as assertivas abaixo sobre o método de agrupamento k-means:
I. Dada uma coleção de objetos, cada um com n atributos, k-means é um método que, para I - um valor escolhido de k, identifica k grupos de objetos com base na proximidade dos objetos com relação ao centroide do grupo. O centro é determinado como a média do vetor n-dimensional de atributos de cada grupo.
II. Por ser um método supervisionado, o K-means ajuda a excluir a subjetividade das análises.
III. K-means é um método para definir agrupamentos. Uma vez que os agrupamentos e os seus centroides são identificados, é fácil classificar novos objetivos para um cluster baseado na distância do objeto do centroide mais próximo.
Quais estão corretas?
Alternativas
Q2172372 Banco de Dados
Relacione a Coluna 1 à Coluna 2, associando as categorias de aprendizado de máquina às suas características.
Coluna 1 1. Aprendizado Supervisionado. 2. Aprendizado Não Supervisionado. 3. Aprendizado Profundo. 
Coluna 2  ( ) O algoritmo recebe um conjunto de dados rotulados e aprende comparando a saída do modelo com a saída esperada, reajustando seus parâmetros até chegar em um limiar aceitável e pré-determinado a priori.
( ) Os algoritmos buscam encontrar padrões ou estruturas em conjuntos de dados não rotulados, por exemplo, gerando agrupamentos de dados.
( ) Conjunto de algoritmos que modelam abstrações de alto nível de dados usando grafos com várias camadas de processamento, compostas de várias transformações lineares e não lineares.
( ) Processo de aprendizado baseado em redes neurais com várias camadas (em geral, mais de cinco camadas): entrada, saída e oculta.
A ordem correta de preenchimento dos parênteses, de cima para baixo, é:

Alternativas
Q2172364 Banco de Dados
Qual é a etapa de modelagem da metodologia CRISP-DM na qual são tratados os valores nulos e pode ser necessário fazer fusão com outros dados? 
Alternativas
Q2133419 Banco de Dados

A respeito de data warehouse e data mining, julgue o próximo item.


Fatos, dimensões e medidas são elementos essenciais de um data warehouse.

Alternativas
Q2133418 Banco de Dados

A respeito de data warehouse e data mining, julgue o próximo item.


O data mining é um processo usado para extrair e analisar informações que revelam padrões ou tendências estratégicas do negócio.

Alternativas
Q2130906 Banco de Dados

Com relação a soluções de suporte à decisão, julgue o item subsecutivo.


Data mining utiliza diversos tipos de padrões e técnicas para descobrir o conhecimento em base de dados. Eles são provenientes, automaticamente, do banco de dados e não há interação manual na descoberta de novos tipos de padrões.


Alternativas
Q2128641 Banco de Dados
Sabendo que existe, na organização em que trabalha, uma base de dados formada por uma grande tabela que contém apenas o id do cliente e colunas do tipo booleano indicando se um cliente possuía ou já tinha possuído cada produto da organização, um funcionário de TI resolveu dividir os clientes em grupos apenas com base nessa informação, utilizando aprendizado de máquina.
Para essa tarefa, o funcionário de TI deve utilizar o aprendizado de máquina
Alternativas
Q2078035 Banco de Dados

No que diz respeito ao modelo de referência CRISP-DM (Cross Industry Standard Process for Data Mining), julgue o item.

No ciclo do CRISP-DM, a fase de implantação é a mais simples (jamais será um processo complexo), pois se resume à execução de scripts.

Alternativas
Q2078034 Banco de Dados

No que diz respeito ao modelo de referência CRISP-DM (Cross Industry Standard Process for Data Mining), julgue o item.

O entendimento do negócio é a fase do ciclo do CRISP-DM que exige mais tempo em mineração de dados, pois estima-se que essa etapa, geralmente, leve entre 50 e 70% do tempo e do esforço de um projeto. 

Alternativas
Q2078033 Banco de Dados

No que diz respeito ao modelo de referência CRISP-DM (Cross Industry Standard Process for Data Mining), julgue o item.

Modelagem e avaliação são algumas das fases do ciclo do CRISP-DM. 

Alternativas
Respostas
81: C
82: E
83: E
84: E
85: D
86: A
87: E
88: B
89: B
90: B
91: C
92: B
93: B
94: C
95: C
96: E
97: B
98: E
99: E
100: C