Em análise de conglomerados, por muitos chamada de análise d...

Próximas questões
Com base no mesmo assunto
Q113222 Estatística
Em análise de conglomerados, por muitos chamada de análise de clusters, cita-se dois métodos conhecidos: o método hierárquico e o k-médias ( k-means ). Sobre o método hierárquico, pode-se afirmar:
Alternativas

Comentários

Veja os comentários dos nossos alunos

Letra B

Os métodos hierárquicos são técnicas simples onde os dados são particionados sucessivamente, produzindo uma representação hierárquica dos agrupamentos. Essa representação facilita a visualização sobre a formação dos agrupamentos em cada estágio onde ela ocorreu e com que grau de semelhança entre eles. Os métodos hierárquicos não requerem que seja definido um número a priori de agrupamentos

No método hierárquico é gerado um cluster para cada elemento. Depois, são identificados os clusters mais similares calculando-se a distância entre eles. Ao unir um cluster a outro, a distância dele para as demais variáveis é recalculada. Com isso, é possível ver que à medida em que a amostra de dados cresce, também cresce o recurso computacional (memória, espaço, processamento, etc.).

Hierarchical clustering can be computationally intensive, especially for large datasets, as it involves calculating and updating the distances between many pairs of points or clusters. The agglomerative approach has a time complexity of O(n3)O(n3), where nn is the number of data points.

Sobre o método hierárquico de análise de conglomerados, podemos analisar as alternativas:

A) É um método mais subjetivo que o k-médias, o analista precisa ter excelente conhecimento do fenômeno estudado.

Incorreto. O método hierárquico é menos subjetivo em termos de necessidade de conhecimento profundo do fenômeno estudado do que o método k-médias, pois o método hierárquico não requer que o número de clusters seja especificado a priori. No entanto, a interpretação dos clusters pode exigir conhecimento do domínio.

B) Exige recursos computacionais elevados para ser trabalhado com grandes amostras.

Correto. O método hierárquico pode ser computacionalmente intensivo, especialmente com grandes amostras, porque a complexidade aumenta exponencialmente com o número de observações.

C) Analisa o relacionamento entre as variáveis dependentes e independentes.

Incorreto. O método hierárquico é usado para agrupar dados em clusters baseados na similaridade das observações, não para analisar relacionamentos entre variáveis dependentes e independentes.

D) É fundamental que o pesquisador defina a priori a quantidade de agrupamentos a serem analisados, sem essa definição, não é possível fazer quaisquer análises.

Incorreto. No método hierárquico, o número de clusters não precisa ser definido a priori. O método gera uma árvore de clusters (dendrograma) e o número de clusters pode ser escolhido com base na análise do dendrograma.

E) Não é conveniente padronizar as variáveis.

Incorreto. Na análise hierárquica, é importante padronizar as variáveis se elas estiverem em escalas diferentes, para evitar que variáveis com maior escala dominem a análise.

Portanto, a alternativa correta é:

B) Exige recursos computacionais elevados para ser trabalhado com grandes amostras.

Clique para visualizar este comentário

Visualize os comentários desta questão clicando no botão abaixo