No que se refere a data mining e sistemas de suporte a decis...

Com base no mesmo assunto

Q275977

Ano: 2012 Banca: CESPE / CEBRASPE Órgão: TJ-RO Prova: CESPE - 2012 - TJ-RO - Analista Judiciário - Análise de Sistemas - Desenvolvimento |

Q275977 Banco de Dados

No que se refere a data mining e sistemas de suporte a decisão, assinale a opção correta.

A técnica de clustering em data mining utiliza os algoritmos ID3 e o C4.5. Esses algoritmos produzem árvores de decisão, o que permite gerar clusters de elementos que, por sua vez, geram mapeamento dos elementos em grupos predefinidos.

Utilizando-se a técnica dice em data mining, é possível descobrir regras do tipo basket data, em que cada tupla consiste em um conjunto de atributos binários chamados itens.

A técnica de associação em data mining verifica se há controle ou influência entre atributos ou valores de atributos, no intuito de verificar, mediante a análise de probabilidades condicionais, dependências entre esses atributos.

Data mining é o processo não trivial de identificar, em bases de dados, padrões válidos, novos e potencialmente úteis ao usuário. KDD (knowledge discovery in databases) é um processo dentro do data mining.

A técnica de classificação em data mining possibilita a definição de classes e o enquadramento de elementos em grupos de afinidades, por meio de avaliação de similaridade entre esses elementos.

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Gabarito comentado

Confira o gabarito comentado por um dos nossos professores

Gabarito: C

O assunto em questão aborda Data Mining (Mineração de Dados) e sistemas de suporte à decisão. O conhecimento necessário para resolver essa questão envolve compreender diferentes técnicas de Data Mining, como clustering, associação, e classificação, além de outros conceitos como KDD (Knowledge Discovery in Databases).

Para compreender por que a alternativa C é a correta, é importante saber que a técnica de associação busca padrões de relacionamento entre variáveis em grandes bancos de dados. Por exemplo, essa técnica pode ser utilizada para encontrar itens que frequentemente são comprados juntos em um supermercado. A análise de probabilidades condicionais é um componente central dessa técnica, pois permite verificar a probabilidade de ocorrência de um item dado a presença de outro(s), identificando assim dependências entre esses atributos.

Portanto, a alternativa C está correta porque descreve acertadamente o processo de verificação de controle ou influência entre atributos (ou valores de atributos), fundamental na técnica de associação em Data Mining, que utiliza probabilidades condicionais para determinar dependências entre os atributos analisados.

Clique para visualizar este gabarito

Visualize o gabarito desta questão clicando no botão abaixo

Comentários

Veja os comentários dos nossos alunos

resposta correta letra C

LETRA D - o Data Mining é uma fase do KDD.

GAB C
Regras de Associação
-Relacionam a presença de um conjunto de itens com outra faixa de valores de um outro conjunto de variáveis.

SOBRE A LETRA E:

Classificação
- É o processo de encontrar um conjunto de modelos que descrevem e distinguem classes ou conceitos.

Quanto à alternativa E.

Na verdade, a assertativa traduz o conceito geral da técnica de Clustering e não de Classificação.

O objetivo principal de clustering é separar objetos ou observações em classes naturais, de forma que, os elementos pertencentes a um mesmo grupo tenham um alto grau de semelhança ou similaridade, enquanto que, quaisquer elementos pertencentes a grupos distintos, tenham pouca semelhança entre si.

Quanto à letra A - algoritmos ID3 e C4.5 são para árvore de decisão (classificação). K-means, na verdade, que é para clusterização.

Gabarito: C

A) Algoritmos ID3 e C4.5 são para árvore de decisão (classificação). K-means, na verdade, que é para clusterização.

As árvores de decisão são representações simples do conhecimento e têm sido aplicadas em sistemas de aprendizado. Elas são amplamente utilizadas em algoritmos de classificação, como um meio eficiente para construir classificadores que predizem classes baseadas nos valores de atributos. Assim, podem ser utilizadas em várias aplicações como diagnósticos médicos, análise de risco em créditos, entre outros exemplos.

B) Basket é regra de associação;

D) Embora KDD e Data Mining sejam frequentemente entendidos como sinônimos, é importante frisar que, enquanto o KDD compreende todas as etapas para a descoberta do conhecimento a partir da existência de dados, a Mineração de Dados é apenas e tão somente uma das etapas do processo.

E) O objetivo principal de clustering é separar objetos ou observações em classes naturais, de forma que, os elementos pertencentes a um mesmo grupo tenham um alto grau de semelhança ou similaridade, enquanto que, quaisquer elementos pertencentes a grupos distintos, tenham pouca semelhança entre si.

Aprofundando:

Cada tipo de aplicação de DM é suportado por um conjunto de aproximações algorítmicas que são utilizadas para extrair as relações relevantes nos dados. Estas aproximações diferem em função do tipo de problema que visam solucionar. A maioria dos investigadores nesta área divide os estudos de DM da seguinte forma:

º Classificação e regressão (aprendizagem supervisionada);

º Clusterização (aprendizagem não supervisionada);

º Associação (aprendizagem não supervisionada);

º Análise de sequenciação (aprendizagem não supervisionada);

º Estimação (aprendizagem supervisionada);

º Visualização.

Clique para visualizar este comentário

Visualize os comentários desta questão clicando no botão abaixo

Quer um estudo ilimitado?