[Questão inédita] Considerando o campo da Ciência de Dados,...
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
D
Limpeza de dados é o processo de identificar e corrigir registros inconsistentes, incompletos ou imprecisos em um conjunto de dados.
A limpeza de dados é um processo essencial para preparar dados brutos para aplicações de machine learning (ML) e business intelligence (BI). Dados brutos podem conter vários erros, que podem afetar a precisão dos modelos de ML e levar a previsões incorretas e causar um impacto negativo nos negócios.
As principais etapas da limpeza de dados incluem: modificar e remover campos de dados incorretos ou incompletos, identificar e remover informações duplicadas ou dados não relacionados e corrigir formatação, valores ausentes ou erros de ortografia.
Portanto, a alternativa D apresenta a definição mais precisa da limpeza de dados:
Identificação de registros inconsistentes: Encontrar e marcar registros que apresentam valores incorretos, incompletos ou fora do padrão esperado.
Correção de erros: Corrigir os erros identificados nos registros, utilizando técnicas como imputação de valores, validação de dados e padronização de formatos.
Garanta a qualidade dos dados: Assegurar que o conjunto de dados esteja livre de erros, completo, consistente e confiável para as análises subsequentes.
A importância da limpeza de dados:
Análises precisas: Dados limpos garantem que as análises sejam precisas e confiáveis, levando a insights mais valiosos e decisões mais eficazes.
Modelos de aprendizado de máquina eficazes: Dados limpos são essenciais para o treinamento de modelos de aprendizado de máquina precisos e robustos.
Evita vieses e distorções: A limpeza de dados ajuda a identificar e remover vieses e distorções nos dados, o que garante análises mais justas e imparciais.
Redução de custos: Dados limpos podem reduzir o tempo e os recursos necessários para a análise de dados, economizando tempo e dinheiro.
Dentro do processo de criação ou alimentação de um Banco de dados é essencial a capacidade de selecionar dados corretos, por isso devemos "Limpar os dados" para evitar dados incompletos, corrimpidos ou repetivos. Portanto, a alternativa correta é D
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo