Em relação aos conceitos do algoritmo k-means, julgue os ite...

Próximas questões
Com base no mesmo assunto
Q3015577 Algoritmos e Estrutura de Dados

Em relação aos conceitos do algoritmo k-means, julgue os itens a seguir.


I É importante continuar as iterações do algoritmo k-means até que a mudança na posição dos centroides entre as iterações seja menor que um limite predefinido.


II No coeficiente de silhueta, quanto mais próximo o coeficiente estiver de 1, menor a distância entre os clusters; 0 indica que os dados podem estar no cluster errado; valores negativos sugerem que o ponto está na borda.


III Apesar de um maior número clusters sempre reduzir o SSE (sum of squared errors), isso não significa que mais clusters sempre sejam melhores, pois um número muito grande de clusters pode levar a overfitting do modelo.


Assinale a opção correta. 

Alternativas

Gabarito comentado

Confira o gabarito comentado por um dos nossos professores

Alternativa Correta: C - Apenas os itens I e III estão certos.

Vamos explorar o tema abordado, que gira em torno do algoritmo k-means, uma técnica de aprendizado não supervisionado amplamente utilizada para particionamento de dados em clusters. Esse método é fundamental para tarefas de agrupamento em ciência de dados e análise de padrões.

Item I: O primeiro item está correto. Uma prática comum no algoritmo k-means é continuar as iterações até que a mudança na posição dos centroides entre as iterações seja menor que um limite predefinido. Isso evita iterações desnecessárias e ajuda o algoritmo a convergir de forma eficiente, garantindo que as alterações nos agrupamentos sejam insignificantes ou nulas antes de encerrar o processo.

Item II: Este item está incorreto. O coeficiente de silhueta mede o quão similar um objeto é ao seu próprio cluster em relação a outros clusters. Quanto mais próximo de 1, melhor bem separado está o cluster. Um valor de 0 indica que o ponto está em uma borda, e valores negativos sugerem que pode estar no cluster errado. Portanto, a descrição na questão está invertida em relação a 0 e valores negativos.

Item III: Este item está correto. Embora aumentar o número de clusters reduza o Sum of Squared Errors (SSE), indicando uma melhor "ajuste" aos dados, isso não é sempre desejável. Um número excessivo de clusters pode levar ao overfitting, onde o modelo se ajusta demais aos dados, capturando ruído ao invés de padrões reais. Este é um conceito crítico na escolha do número adequado de clusters.

Compreender o funcionamento e as limitações do algoritmo k-means é essencial para aplicá-lo de maneira eficaz em problemas reais, além de avaliar corretamente quais métricas de validação utilizar, como o coeficiente de silhueta.

Gostou do comentário? Deixe sua avaliação aqui embaixo!

Clique para visualizar este gabarito

Visualize o gabarito desta questão clicando no botão abaixo

Comentários

Veja os comentários dos nossos alunos

A alternativa correta: letra C

O K-Means é um algoritmo de aprendizado não supervisionado utilizado para resolver problemas de clustering. Ele tenta dividir um conjunto de dados em clusters, onde cada grupo contém pontos de dados semelhantes. O objetivo é minimizar a variância dentro de cada cluster.

Item I: Correto. O K-Means continua ajustando os centroides (pontos que representam o centro de cada cluster) até que as mudanças de posição entre as iterações sejam menores que um limite predefinido ou até que um número máximo de iterações seja alcançado.

Item II: Errado. O coeficiente de silhueta varia de -1 a 1. Um valor próximo de 1 indica que o ponto está bem atribuído ao seu cluster, enquanto valores próximos de 0 indicam que o ponto está na fronteira entre dois clusters. Valores negativos indicam que o ponto foi mal atribuído e, portanto, está no cluster errado.

Item III: Correto. Embora um maior número de clusters sempre reduza o SSE (Sum of Squared Errors), isso não significa que mais clusters sempre sejam melhores.

Clique para visualizar este comentário

Visualize os comentários desta questão clicando no botão abaixo