Em relação à análise de agrupamentos, considere os seguintes...
I. análise do nível de fusão;
II. análise do nível de similaridade;
III. análise do coeficiente R2 ;
IV. estatística pseudo F.
Para auxiliar na decisão do número final de grupos que define a partição dos dados, pode-se utilizar os critérios apresentados nas alternativas
Comentários
Veja os comentários dos nossos alunos
Análise de agrupamento, ou clustering, é o nome dado para o grupo de técnicas computacionais cujo propósito consiste em separar objetos em grupos, baseando-se nas características que estes objetos possuem. A idéia básica consiste em colocar em um mesmo grupo objetos que sejam similares de acordo com algum critério pré-determinado.
O critério baseia-se normalmente em uma função de dissimilaridade, função esta que recebe dois objetos e retorna a distância entre eles. Os grupos determinados por uma métrica de qualidade devem apresentar alta homogeneidade interna e alta separação (heterogeneidade externa). Isto quer dizer que os elementos de um determinado conjunto devem ser mutuamente similares e, preferencialmente, muito diferentes dos elementos de outros conjuntos.
A análise de agrupamento é uma ferramenta útil para a análise de dados em muitas situações diferentes. Esta técnica pode ser usada para reduzir a dimensão de um conjunto de dados, reduzindo uma ampla gama de objetos à informação do centro do seu conjunto.
Infelizmente o problema de agrupamento apresenta uma complexidade de ordem exponencial. Isto quer dizer que métodos de força bruta, como enumerar todos os possíveis grupos e escolher a melhor configuração, não são viáveis.
Um dos grandes problemas da análise de agrupamentos é determinar o Número g de Clusters da Partição Final. Para tanto existem algumas técnicas relacionadas a essas partições:
1. Nível de fusão (distância);
2. Nível de similaridade;
3. Coeficiente R² ;
4. Estatística Pseudo F;
5. Correlação semiparcial (Ward);
6. Estatística Pseudo T2 ;
7. Estatística CCC (Cubic Clustering Criterion);
Gabarito: Letra A
Para auxiliar na decisão do número final de grupos em uma análise de agrupamentos, os critérios listados podem ser utilizados da seguinte maneira:
I. Análise do nível de fusão: Refere-se à observação das mudanças na similaridade ou dissimilaridade ao longo do processo de fusão em métodos hierárquicos. Grandes saltos entre níveis consecutivos de fusão podem indicar o número apropriado de grupos.
II. Análise do nível de similaridade: Similar à análise do nível de fusão, este critério observa como a similaridade entre os elementos muda conforme se unem em grupos maiores.
III. Análise do coeficiente R²: O coeficiente R² mede a proporção da variância total que é explicada pela partição dos grupos. Um valor mais alto de R² pode indicar um agrupamento mais apropriado.
IV. Estatística pseudo F: A estatística pseudo F compara a variabilidade entre os grupos com a variabilidade dentro dos grupos. Um valor maior pode indicar que os grupos são significativamente diferentes.
Desses critérios, todos (I, II, III e IV) são válidos para ajudar na decisão do número final de grupos. Portanto, a alternativa correta é:
A) I, II, III e IV.
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo