O agrupamento de dados no processo de data mining procura, e...
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
Gabarito: E - Árvore geradora mínima.
No contexto de Data Mining, o processo de agrupamento é uma tarefa fundamental e tem como objetivo principal identificar estruturas ou padrões em um conjunto de dados. Para resolver esta questão, o conhecimento necessário seria sobre diferentes algoritmos de agrupamento e o entendimento de suas características e aplicações.
A alternativa E é a correta porque o algoritmo de Árvore Geradora Mínima (Minimum Spanning Tree - MST) é uma abordagem baseada na teoria dos grafos que não exige a pré-definição de um protótipo, como acontece com algoritmos como K-médias ou K-medoides. A MST liga todos os pontos do dataset com a mínima soma de distâncias possível e sem formar ciclos, assim, baseando-se nos pesos das arestas, pode-se segmentar os dados criando grupos a partir da remoção de arestas mais longas.
Os algoritmos de agrupamento baseados em grafos, como a Árvore Geradora Mínima, são úteis em situações onde a estrutura dos grupos não é necessariamente esférica, podendo se adaptar a diferentes formatos e densidades, uma propriedade desejável em muitos cenários reais de Data Mining.
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
ok, baseado em Grafos, mas o que tem a ver com Data Mining? Como aplicar a MST em Data Mining? Até em redes tudo bem, mas em DM não estou conseguindo visualizar
Agrupamento é uma tarefa importante na mineração de dados, tendo como objetivo segmentar uma base de dados em grupos de objetos baseando-se na similaridade ou dissimilaridade entre os mesmos.
Aárvore geradora mínima (MST, do inglês Minimum Spanning Tree) de um grafo não orientado é a árvore que conecta todos os vértices do grafo com o menor peso total possível Os algoritmos de agrupamento de dados baseados em árvores geradoras mínimas são capazes de detectar grupos com fronteiras irregulares.
Para quem quiser mais:
a) https://en.wikipedia.org/wiki/K-means_clustering
b) https://pt.wikipedia.org/wiki/Algoritmo_apriori
c) https://pt.wikipedia.org/wiki/Algoritmo_apriori
d) https://en.wikipedia.org/wiki/DBSCAN
e) https://pt.stackoverflow.com/questions/22245/o-que-%C3%A9-%C3%A1rvore-geradora-m%C3%ADnima
Uma arvore geradora e chamada minima se, dentre todas as arvores geradoras que existem no grafo, a soma dos pesos nas arestas dela e o menor possível.
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo