Em agrupamento de dados, o algoritmo k-means é aplicado por ...

Próximas questões
Com base no mesmo assunto
Q1090450 Banco de Dados
Em agrupamento de dados, o algoritmo k-means é aplicado por várias aplicações que demandam a criação de clusters. Sua abordagem heurística, progressivamente refina a qualidade dos grupos formados, buscando a estabilidade em um ótimo local.
Uma das características desse algoritmo é a de
Alternativas

Gabarito comentado

Confira o gabarito comentado por um dos nossos professores

Alternativa correta: B - apresentar sua similaridade intragrupo maximizada e intergrupos minimizada pela sua função-objetivo.

Para compreender essa questão, é essencial ter conhecimento sobre algoritmos de agrupamento, especificamente o método k-means. Este algoritmo tem como objetivo dividir um conjunto de dados em K grupos (clusters), onde cada ponto de dados pertence ao grupo mais próximo, de acordo com a média (centroide) dos pontos do grupo. O processo passa por diversas iterações, onde os centroides dos grupos são recalculados e os pontos são realocados ao grupo cujo centroide está mais próximo, com base na distância euclidiana.

Justificativa para a alternativa B estar correta:

  • O algoritmo k-means busca minimizar a variância dentro de cada cluster, ou seja, a soma das distâncias quadradas entre os pontos de dados e o centroide do seu respectivo cluster - isso é conhecido como a similaridade intragrupo. A função-objetivo é precisamente essa soma das distâncias ao quadrado, que o algoritmo tenta minimizar.
  • Minimizar essa função-objetivo implica diretamente em encontrar uma configuração onde os pontos dentro de cada cluster são o mais próximo possível um do outro, enquanto os clusters estão o mais distante possível entre si - garantindo assim a maximização da similaridade intragrupo e a minimização da similaridade intergrupos.

Os demais itens mencionam características que não correspondem à natureza do algoritmo k-means, como autodeterminação do número de clusters, o que não é feito pelo k-means standard, ou ser um algoritmo hierárquico, o que descreve outro tipo de técnica de agrupamento de dados.

Portanto, relacionar o algoritmo k-means com a otimização da função-objetivo para alcançar uma configuração ideal de grupos é o entendimento correto para essa questão.

Clique para visualizar este gabarito

Visualize o gabarito desta questão clicando no botão abaixo

Comentários

Veja os comentários dos nossos alunos

Tipo de questão que o cara chuta.

Em, agrupamento k-means é um método de que objetiva n observações dentre k grupos onde cada observação pertence ao grupo mais próximo da média.

 

Fonte:https://pt.wikipedia.org/wiki/K-means

A - A complexidade do k-means não possui expoentes.

B - Bem genérico. O objetivo de qualquer algoritmo de cluster é maximizar o agrupamento entre similares, mas por não ter outra alternativa certa, esse é o gabarito.

C - Na real, como k-means usa centróides(ponto central baseado na média), ele é bem sensível aos outliers. K-medois e DBSCAN lidam melhor com outliers que o k-means.

D - O único algoritmo hierarquico de cluterização é o Hierarquical agglomerative clustering. DBSCA, k-means e k-medois não são.

E - k-means significa que o algoritmo vai calcular k (uma incógnita que você decide) pontos médios (means). Ele não tem a capacidade de decidir qual o melhor número de clusters por si só.

Clique para visualizar este comentário

Visualize os comentários desta questão clicando no botão abaixo