Castro e Ferrari (2016) ilustram na Figura abaixo o processo...
Castro e Ferrari (2016) ilustram na Figura abaixo o processo de descoberta de conhecimento em base de dados, conforme segue:
Sobre essas etapas, considere as seguintes tarefas:
1. Limpeza: para padronização dos dados.
2. Integração: para inserção de valores ausentes.
3. Transformação: para correção de inconsistências.
4. Redução: para reduzir a dimensão da base de dados.
É/São tarefa(s) de pré-processamento:
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
Alternativa correta: B - 4 apenas.
O tema desta questão está centrado no pré-processamento de dados, uma etapa crítica no processo de descoberta de conhecimento em bases de dados. Este processo é também conhecido como KDD (Knowledge Discovery in Databases) e envolve diversas fases até a extração de conhecimento útil.
No contexto da questão, o pré-processamento de dados inclui várias tarefas essenciais que preparam os dados brutos para a análise subsequente. Vamos entender cada etapa mencionada:
1. Limpeza: Esta etapa é responsável pela remoção de ruídos e correção de inconsistências nos dados. Não está diretamente relacionada com padronização, como mencionado na questão, mas sim com a eliminação de dados irrelevantes ou incorretos.
2. Integração: Refere-se à combinação de dados de diferentes fontes, mas a inserção de valores ausentes não é seu foco principal. Valores ausentes geralmente são tratados na etapa de limpeza ou imputação.
3. Transformação: Envolve a modificação dos dados para adequá-los a um formato apropriado para a mineração, corrige inconsistências e padroniza os dados. No entanto, sua descrição na questão está incorreta para o propósito de pré-processamento.
4. Redução: Esta etapa visa a redução da dimensão da base de dados, tornando-a mais manejável e eliminando a redundância de dados. Esta é uma tarefa clara de pré-processamento, pois busca otimizar o tamanho e a relevância dos dados antes da análise.
Portanto, a alternativa B é a correta, pois a redução é efetivamente uma tarefa de pré-processamento de dados. As outras alternativas não estão de acordo com o propósito específico da etapa mencionada.
Gostou do comentário? Deixe sua avaliação aqui embaixo!
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
O processo de transformação dos dados em conhecimento contém uma série de etapas, Castanheira (2008, p.15) destaca que: “o processo KDD é um conjunto de atividades contínuas que compartilham o conhecimento descoberto a partir de bases de dados”. Essas atividades são: base de dados, seleção dos dados, preparação / pré-processamento e limpeza, transformação, mineração de dados (Data Mining) e interpretação / avaliação.
A primeira etapa é a Base de Dados, são nas Base de Dados que são retiradas as informações para obter o conhecimento desejado, Castro e Ferrari (2016, p.5), conceitua que “os dados podem ser entendidos como o nível mais básico de abstração a partir do qual a informação e, depois, os conhecimentos podem ser extraídos”.
Segunda etapa desse processo é a fase de Seleção de Dados, é a etapa em que os conjuntos de dados são identificado e selecionados na base de dados, no dizer de Goldschmidt et al. (2015, p.23): “esta função, também denominada Redução de Dados, compreende, em essência, a identificação do subconjunto das bases de dados existentes que deve ser efetivamente considerado durante o processo de KDD”
A Preparação ou Pré Processamento de dados é o momento em que os dados são preparados para utilizar às técnicas de mineração de dados, Goldschmidt et al. (2015, p.23) exemplifica que “esta etapa tem como objetivo a preparação dos dados para os algoritmos que serão aplicados na etapa de mineração de dados”.
Próxima etapa é a Limpeza dos Dados, em que é realizado o tratamento nos dados para ter corretude dos dados coletados, é a fase em que os dados não corretos são excluídos, Castro e Ferrari (2016, p36) explanam:” a limpeza dos dados atua no sentido de imputar valores ausentes, suavizar ruídos, identificar valores discrepantes (outliers) e corrigir inconsistências”.
Transformação do Dados, os dados são formatados, para que os algoritmos de Data Mining, possam ser aplicados.
Mineração de Dados, ocorre o processamento dos dados, para que se possa identificar as informações importantes nas Bases de Dados, é nesta etapa em que os algoritmos e as técnicas de mineração de dados são aplicados[...}
Avaliação ou Validação de conhecimento, são os resultados encontrados no processo da Mineração de Dados, essa última etapa se preocupa em verificar se algum conhecimento útil foi descoberto, mostrando a importância dos dados descobertos. Essa etapa tem a finalidade de observar os conhecimentos obtidos são: verdadeiros, úteis e não triviais (CASTRO; FERRARI, 2016)
Fonte: http://repositorio.aee.edu.br/jspui/bitstream/aee/53/3/TCC2_2017_02_TatianeGomes.pdf
As principais tarefas de pré-processamento são:
Limpeza: para imputação de valores ausentes, remoção de ruídos e correção de inconsistências;
Integração: para unir dados de múltiplas fontes em um único local, como um armazém de dados (data warehouse);
Redução: para reduzir a dimensão da base de dados, por exemplo, agrupando ou eliminando atributos redundantes, ou para reduzir a quantidade de objetos da base, sumarizando os dados;
Transformação: para padronizar e deixar os dados em um formato passível de aplicação das diferentes técnicas de mineração;
Discretização: para permitir que métodos que trabalham apenas com atributos nominais possam ser empregados a um conjunto maior de problemas.
O objetivo das técnicas de pré-processamento de dados é preparar os dados brutos para serem analisados sem erros de incompletudes, inconsistências e ruídos. E também visa diminuir a quantidade de dados que serão analisados, por meio da aplicação de filtros e de eliminadores de palavras.
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo