Em relação à análise de agrupamentos, considere os seguintes...

Próximas questões
Com base no mesmo assunto
Q417740 Estatística
Em relação à análise de agrupamentos, considere os seguintes critérios:

I. análise do nível de fusão;
II. análise do nível de similaridade;
III. análise do coeficiente R2 ;
IV. estatística pseudo F.

Para auxiliar na decisão do número final de grupos que define a partição dos dados, pode-se utilizar os critérios apresentados nas alternativas
Alternativas

Comentários

Veja os comentários dos nossos alunos

Análise de agrupamento, ou clustering, é o nome dado para o grupo de técnicas computacionais cujo propósito consiste em separar objetos em grupos, baseando-se nas características que estes objetos possuem. A idéia básica consiste em colocar em um mesmo grupo objetos que sejam similares de acordo com algum critério pré-determinado.

 

O critério baseia-se normalmente em uma função de dissimilaridade, função esta que recebe dois objetos e retorna a distância entre eles. Os grupos determinados por uma métrica de qualidade devem apresentar alta homogeneidade interna e alta separação (heterogeneidade externa). Isto quer dizer que os elementos de um determinado conjunto devem ser mutuamente similares e, preferencialmente, muito diferentes dos elementos de outros conjuntos.

 

A análise de agrupamento é uma ferramenta útil para a análise de dados em muitas situações diferentes. Esta técnica pode ser usada para reduzir a dimensão de um conjunto de dados, reduzindo uma ampla gama de objetos à informação do centro do seu conjunto.

 

Infelizmente o problema de agrupamento apresenta uma complexidade de ordem exponencial. Isto quer dizer que métodos de força bruta, como enumerar todos os possíveis grupos e escolher a melhor configuração, não são viáveis.

 

Um dos grandes problemas da análise de agrupamentos é determinar o Número g de Clusters da Partição Final. Para tanto existem algumas técnicas relacionadas a essas partições:

 

1. Nível de fusão (distância);

2. Nível de similaridade;

3. Coeficiente R² ;

4. Estatística Pseudo F;

5. Correlação semiparcial (Ward);

6. Estatística Pseudo T2 ;

7. Estatística CCC (Cubic Clustering Criterion);

 

Gabarito: Letra A

Para auxiliar na decisão do número final de grupos em uma análise de agrupamentos, os critérios listados podem ser utilizados da seguinte maneira:

I. Análise do nível de fusão: Refere-se à observação das mudanças na similaridade ou dissimilaridade ao longo do processo de fusão em métodos hierárquicos. Grandes saltos entre níveis consecutivos de fusão podem indicar o número apropriado de grupos.

II. Análise do nível de similaridade: Similar à análise do nível de fusão, este critério observa como a similaridade entre os elementos muda conforme se unem em grupos maiores.

III. Análise do coeficiente R²: O coeficiente R² mede a proporção da variância total que é explicada pela partição dos grupos. Um valor mais alto de R² pode indicar um agrupamento mais apropriado.

IV. Estatística pseudo F: A estatística pseudo F compara a variabilidade entre os grupos com a variabilidade dentro dos grupos. Um valor maior pode indicar que os grupos são significativamente diferentes.

Desses critérios, todos (I, II, III e IV) são válidos para ajudar na decisão do número final de grupos. Portanto, a alternativa correta é:

A) I, II, III e IV.

Clique para visualizar este comentário

Visualize os comentários desta questão clicando no botão abaixo