Um dos problemas mais comuns para o emprego de análise mult...

Próximas questões
Com base no mesmo assunto
Q1885657 Estatística
Um dos problemas mais comuns para o emprego de análise multivariada é o problema de agrupamento - 'clustering' de dados estruturados a partir de uma métrica. Considere os pontos descritos pelo par de variáveis aleatórias (x, y) usadas para classificar um determinado grupo de objetos.

Imagem associada para resolução da questão

Os agrupamentos são testados utilizando-se a métrica (M),

Imagem associada para resolução da questão

onde n é o número de agrupamentos e Dj é uma medida de dispersão do j-ésimo grupo em relação ao centróide (xcj, ycj) de cada grupo.
Considera-se a melhor combinação de agrupamentos aquela que tem o maior valor para a métrica.
Foram escolhidas duas formas agrupar esses pontos: (A) com dois agrupamentos (n=2); e (B) com três agrupamentos (n=3). A tabela abaixo apresenta os agrupamentos escolhidos e os valores aproximados para a dispersão Dj em cada caso.

Imagem associada para resolução da questão

Assinale a alternativa que apresenta a melhor forma de agrupamento dentro dessa métrica e o valor aproximado para a métrica.
Alternativas