Questões de Estatística - Análise de Cluster para Concurso
Foram encontradas 8 questões
Tabela 2. Dados da questão 40 Elemento Variável 1 Variável 2 Variável 3 1 2 3 2 2 -2 2 3
O valor da distância entre esses dois elementos amostrais é igual a
A respeito das medidas de similaridade e dissimilaridade no âmbito da teoria de análise de agrupamentos (cluster), considere as seguintes afirmativas:
1. A distância de Minkowsky entre dois pontos Xl e Xk é muito mais afetada pela presença de valores discrepantes na amostra do que a distância euclidiana. Para λ = 1, a distância de Minkowsky é conhecida como city-block ou Manhattan.
2. O coeficiente de concordância positiva é definido como o número de pares realmente concordantes em relação ao número total de pares. Quanto maior o seu valor, maior é a concordância entre os elementos comparados, razão pela qual é um índice de similaridade.
3. A distância euclidiana média revela que, quanto menor o valor da distância, maior será a similaridade dos elementos comparados; portanto é um índice de discordância ou de dissimilaridade.
4. O coeficiente de Jaccard tem o mesmo objetivo que o coeficiente de concordância positiva. A diferença é que a proporção de pares concordantes é calculada em relação ao número total de pares, excluindo-se os pares do tipo (0 0).
Assinale a alternativa correta.
I. análise do nível de fusão;
II. análise do nível de similaridade;
III. análise do coeficiente R2 ;
IV. estatística pseudo F.
Para auxiliar na decisão do número final de grupos que define a partição dos dados, pode-se utilizar os critérios apresentados nas alternativas