Quanto aos processos de ETL, ao JSON, ao XML e às técnicas p...
A imputação por moda é uma técnica comumente utilizada no pré‑processamento de dados, para se lidar com valores ausentes.
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
A alternativa correta é a letra C.
Vamos entender melhor por que essa alternativa está correta e discutir o tema abordado na questão.
O tema da questão envolve processos de pré-processamento de dados, especificamente uma técnica chamada imputação. O pré-processamento de dados é uma etapa crucial em projetos de Data Science e Mineração de Dados, pois garante que os dados estejam em um formato apropriado para análise.
Uma das tarefas comuns no pré-processamento é lidar com valores ausentes (missing values). Existem várias técnicas para tratar esses valores ausentes, e uma delas é a imputação por moda.
Imputação por Moda
Imputação por moda é uma técnica em que os valores ausentes em uma coluna de dados (variável) são substituídos pelo valor que mais frequentemente ocorre nessa coluna. Em outras palavras, a moda é o valor mais frequente. Essa técnica é útil em situações onde os dados ausentes são categóricos ou discretos e onde substituir pelo valor mais comum faz sentido no contexto dos dados.
Por exemplo, se você tiver uma coluna que representa a cor dos carros em um estacionamento e alguns valores estão ausentes, você poderia substituir esses valores pela cor mais comum (por exemplo, "branco" se a maioria dos carros forem brancos).
A alternativa C está correta porque a imputação por moda é, de fato, uma técnica comum para lidar com valores ausentes durante o pré-processamento de dados.
Por que as outras alternativas estão incorretas?
Nesta questão, não há outras alternativas apresentadas, mas é importante entender que a imputação por moda é apenas uma das várias técnicas de imputação. Outras técnicas incluem imputação pela média, imputação pela mediana, ou até mesmo métodos mais sofisticados como imputação baseada em algoritmos de machine learning.
Em resumo, a questão é sobre pré-processamento de dados e como lidar com valores ausentes usando a técnica de imputação por moda. A alternativa correta é a letra C porque essa técnica é comumente utilizada.
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
correto
imputação por moda serve pra preencher os valores ausentes com o valor mais frequente (moda) da amostra, tambem tem outros tipos de imputação como por média, por mediana e etc....
A afirmativa está certa.
A imputação por moda é, de fato, uma técnica comum no pré-processamento de dados utilizada para lidar com valores ausentes. Essa técnica envolve substituir os valores ausentes de uma variável categórica pelo valor mais frequente (a moda) dessa variável.
É especialmente útil quando se trabalha com dados categóricos, onde a média ou a mediana não seriam aplicáveis ou significativas.
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo