O algoritmo k-vizinhos mais próximo (k-NN) é utilizado em ta...

Próximas questões
Com base no mesmo assunto
Q3158072 Algoritmos e Estrutura de Dados
O algoritmo k-vizinhos mais próximo (k-NN) é utilizado em tarefas de análise preditiva. Analise as afirmativas a seguir relativas ao algoritmo k-NN.

I O algoritmo k-NN classifica os pontos com base nas distâncias entre eles e seus k vizinhos mais próximos.

II O valor de k deve ser escolhido aleatoriamente e não tem impacto no desempenho do modelo k-NN.

III O algoritmo k-NN é sensível à escala das variáveis de entrada e geralmente requer normalização dos dados antes de ser aplicado.

É correto o que se afirma em
Alternativas

Gabarito comentado

Confira o gabarito comentado por um dos nossos professores

Tema Central da Questão: A questão aborda o algoritmo k-vizinhos mais próximos (k-NN), amplamente utilizado em tarefas de análise preditiva, como classificação e regressão. Este algoritmo é baseado na ideia de que objetos similares estão próximos uns dos outros em um espaço de características.

Resumo Teórico: O algoritmo k-NN classifica um ponto de dados com base nos "k" vizinhos mais próximos no espaço de entrada. A proximidade geralmente é calculada usando métricas de distância, como a distância Euclidiana. O valor de "k" é crítico, pois determina o número de vizinhos a serem considerados na classificação. Além disso, o k-NN é sensível à escala das características, o que geralmente torna necessária a normalização dos dados de entrada.

Justificativa da Alternativa Correta (D):

  • I: Correta. O algoritmo k-NN realmente classifica os pontos com base nas distâncias entre eles e seus k vizinhos mais próximos, utilizando medidas de distância como a distância Euclidiana.
  • III: Correta. O k-NN é sensível à escala das variáveis de entrada. Por isso, é prática comum normalizar os dados antes de aplicar o algoritmo para garantir que todas as características tenham uma influência equivalente.

Análise das Alternativas Incorretas:

  • II: Incorreta. A escolha do valor de "k" não deve ser aleatória. Ele tem um impacto significativo no desempenho do modelo. Um valor muito pequeno pode tornar o modelo sensível ao ruído, enquanto um valor muito alto pode fazer com que o modelo perca características locais importantes.

Entendendo esses conceitos fundamentais, a alternativa correta para a questão é D - I e III, apenas.

Gostou do comentário? Deixe sua avaliação aqui embaixo!

Clique para visualizar este gabarito

Visualize o gabarito desta questão clicando no botão abaixo