O agrupamento de dados no processo de data mining procura, e...

Próximas questões
Com base no mesmo assunto
Q835195 Banco de Dados
O agrupamento de dados no processo de data mining procura, em uma massa de dados que caracterizam uma população de indivíduos, grupos semelhantes e diferentes. O algoritmo baseado na teoria dos grafos e que dispensa a definição de protótipos utilizado para segmentar a base de dados em diferentes grupos é denominado
Alternativas

Gabarito comentado

Confira o gabarito comentado por um dos nossos professores

Gabarito: E - Árvore geradora mínima.

No contexto de Data Mining, o processo de agrupamento é uma tarefa fundamental e tem como objetivo principal identificar estruturas ou padrões em um conjunto de dados. Para resolver esta questão, o conhecimento necessário seria sobre diferentes algoritmos de agrupamento e o entendimento de suas características e aplicações.

A alternativa E é a correta porque o algoritmo de Árvore Geradora Mínima (Minimum Spanning Tree - MST) é uma abordagem baseada na teoria dos grafos que não exige a pré-definição de um protótipo, como acontece com algoritmos como K-médias ou K-medoides. A MST liga todos os pontos do dataset com a mínima soma de distâncias possível e sem formar ciclos, assim, baseando-se nos pesos das arestas, pode-se segmentar os dados criando grupos a partir da remoção de arestas mais longas.

Os algoritmos de agrupamento baseados em grafos, como a Árvore Geradora Mínima, são úteis em situações onde a estrutura dos grupos não é necessariamente esférica, podendo se adaptar a diferentes formatos e densidades, uma propriedade desejável em muitos cenários reais de Data Mining.

Clique para visualizar este gabarito

Visualize o gabarito desta questão clicando no botão abaixo

Comentários

Veja os comentários dos nossos alunos

Árvore geradora

ok, baseado em Grafos, mas o que tem a ver com Data Mining? Como aplicar a MST em Data Mining? Até em redes tudo bem, mas em DM não estou conseguindo visualizar

Agrupamento é uma tarefa importante na mineração de  dados, tendo como objetivo segmentar uma base de dados em grupos de objetos baseando-se na similaridade ou dissimilaridade entre os mesmos.

 

Aárvore geradora mínima (MST, do inglês Minimum Spanning Tree) de um grafo não orientado é a árvore que conecta todos os vértices do grafo com o menor peso total possível Os algoritmos de agrupamento de dados baseados em árvores geradoras mínimas são capazes de detectar grupos com fronteiras irregulares.

 

 

 

 

Para quem quiser mais:

a) https://en.wikipedia.org/wiki/K-means_clustering

b) https://pt.wikipedia.org/wiki/Algoritmo_apriori

c) https://pt.wikipedia.org/wiki/Algoritmo_apriori

d) https://en.wikipedia.org/wiki/DBSCAN

e) https://pt.stackoverflow.com/questions/22245/o-que-%C3%A9-%C3%A1rvore-geradora-m%C3%ADnima

Uma arvore geradora e chamada minima se, dentre todas as arvores geradoras que existem no grafo, a soma dos pesos nas arestas dela e o menor possível. 

Clique para visualizar este comentário

Visualize os comentários desta questão clicando no botão abaixo