Em relação aos conceitos do algoritmo k-means, julgue os itens a
seguir.
I É importante continuar as iterações do algoritmo k-means até
que a mudança na posição dos centroides entre as iterações
seja menor que um limite predefinido.
II No coeficiente de silhueta, quanto mais próximo o coeficiente
estiver de 1, menor a distância entre os clusters; 0 indica que
os dados podem estar no cluster errado; valores negativos
sugerem que o ponto está na borda.
III Apesar de um maior número clusters sempre reduzir o SSE
(sum of squared errors), isso não significa que mais clusters
sempre sejam melhores, pois um número muito grande de
clusters pode levar a overfitting do modelo.
Assinale a opção correta.

Question

Em relação aos conceitos do algoritmo k-means, julgue os itens a
seguir.
I É importante continuar as iterações do algoritmo k-means até
que a mudança na posição dos centroides entre as iterações
seja menor que um limite predefinido.
II No coeficiente de silhueta, quanto mais próximo o coeficiente
estiver de 1, menor a distância entre os clusters; 0 indica que
os dados podem estar no cluster errado; valores negativos
sugerem que o ponto está na borda.
III Apesar de um maior número clusters sempre reduzir o SSE
(sum of squared errors), isso não significa que mais clusters
sempre sejam melhores, pois um número muito grande de
clusters pode levar a overfitting do modelo.
Assinale a opção correta.  Alternativa A: Apenas o item I está certo.   Ou Alternativa B: Apenas o item II está certo.   Ou Alternativa C: Apenas os itens I e III estão certos.   Ou Alternativa D: Apenas os itens II e III estão certos.

Qconcursos · Accepted Answer

Alternativa [C] Apenas os itens I e III estão certos.   Alternativa Correta: C - Apenas os itens I e III estão certos.

Vamos explorar o tema abordado, que gira em torno do algoritmo k-means, uma técnica de aprendizado não supervisionado amplamente utilizada para particionamento de dados em clusters. Esse método é fundamental para tarefas de agrupamento em ciência de dados e análise de padrões.

Item I: O primeiro item está correto. Uma prática comum no algoritmo k-means é continuar as iterações até que a mudança na posição dos centroides entre as iterações seja menor que um limite predefinido. Isso evita iterações desnecessárias e ajuda o algoritmo a convergir de forma eficiente, garantindo que as alterações nos agrupamentos sejam insignificantes ou nulas antes de encerrar o processo.

Item II: Este item está incorreto. O coeficiente de silhueta mede o quão similar um objeto é ao seu próprio cluster em relação a outros clusters. Quanto mais próximo de 1, melhor bem separado está o cluster. Um valor de 0 indica que o ponto está em uma borda, e valores negativos sugerem que pode estar no cluster errado. Portanto, a descrição na questão está invertida em relação a 0 e valores negativos.

Item III: Este item está correto. Embora aumentar o número de clusters reduza o Sum of Squared Errors (SSE), indicando uma melhor "ajuste" aos dados, isso não é sempre desejável. Um número excessivo de clusters pode levar ao overfitting, onde o modelo se ajusta demais aos dados, capturando ruído ao invés de padrões reais. Este é um conceito crítico na escolha do número adequado de clusters.

Compreender o funcionamento e as limitações do algoritmo k-means é essencial para aplicá-lo de maneira eficaz em problemas reais, além de avaliar corretamente quais métricas de validação utilizar, como o coeficiente de silhueta.

Gostou do comentário? Deixe sua avaliação aqui embaixo!

O QC ESTÁ TOTALMENTE GRÁTIS

O QC ESTÁ TOTALMENTE GRÁTIS

Em relação aos conceitos do algoritmo k-means, julgue os ite...

Gabarito comentado

Clique para visualizar este gabarito

Comentários

Clique para visualizar este comentário

Questões de assuntos semelhantes

Provas relacionadas