Castro e Ferrari (2016) ilustram na Figura abaixo o processo...

Próximas questões
Com base no mesmo assunto
Q978924 Biblioteconomia

Castro e Ferrari (2016) ilustram na Figura abaixo o processo de descoberta de conhecimento em base de dados, conforme segue:


Imagem associada para resolução da questão


Sobre essas etapas, considere as seguintes tarefas:

1. Limpeza: para padronização dos dados.

2. Integração: para inserção de valores ausentes.

3. Transformação: para correção de inconsistências.

4. Redução: para reduzir a dimensão da base de dados.

É/São tarefa(s) de pré-processamento:

Alternativas

Gabarito comentado

Confira o gabarito comentado por um dos nossos professores

Alternativa correta: B - 4 apenas.

O tema desta questão está centrado no pré-processamento de dados, uma etapa crítica no processo de descoberta de conhecimento em bases de dados. Este processo é também conhecido como KDD (Knowledge Discovery in Databases) e envolve diversas fases até a extração de conhecimento útil.

No contexto da questão, o pré-processamento de dados inclui várias tarefas essenciais que preparam os dados brutos para a análise subsequente. Vamos entender cada etapa mencionada:

1. Limpeza: Esta etapa é responsável pela remoção de ruídos e correção de inconsistências nos dados. Não está diretamente relacionada com padronização, como mencionado na questão, mas sim com a eliminação de dados irrelevantes ou incorretos.

2. Integração: Refere-se à combinação de dados de diferentes fontes, mas a inserção de valores ausentes não é seu foco principal. Valores ausentes geralmente são tratados na etapa de limpeza ou imputação.

3. Transformação: Envolve a modificação dos dados para adequá-los a um formato apropriado para a mineração, corrige inconsistências e padroniza os dados. No entanto, sua descrição na questão está incorreta para o propósito de pré-processamento.

4. Redução: Esta etapa visa a redução da dimensão da base de dados, tornando-a mais manejável e eliminando a redundância de dados. Esta é uma tarefa clara de pré-processamento, pois busca otimizar o tamanho e a relevância dos dados antes da análise.

Portanto, a alternativa B é a correta, pois a redução é efetivamente uma tarefa de pré-processamento de dados. As outras alternativas não estão de acordo com o propósito específico da etapa mencionada.

Gostou do comentário? Deixe sua avaliação aqui embaixo!

Clique para visualizar este gabarito

Visualize o gabarito desta questão clicando no botão abaixo

Comentários

Veja os comentários dos nossos alunos

O processo de transformação dos dados em conhecimento contém uma série de etapas, Castanheira (2008, p.15) destaca que: “o processo KDD é um conjunto de atividades contínuas que compartilham o conhecimento descoberto a partir de bases de dados”. Essas atividades são: base de dados, seleção dos dados, preparação / pré-processamento e limpeza, transformação, mineração de dados (Data Mining) e interpretação / avaliação.

A primeira etapa é a Base de Dados, são nas Base de Dados que são retiradas as informações para obter o conhecimento desejado, Castro e Ferrari (2016, p.5), conceitua que “os dados podem ser entendidos como o nível mais básico de abstração a partir do qual a informação e, depois, os conhecimentos podem ser extraídos”.

Segunda etapa desse processo é a fase de Seleção de Dados, é a etapa em que os conjuntos de dados são identificado e selecionados na base de dados, no dizer de Goldschmidt et al. (2015, p.23): “esta função, também denominada Redução de Dados, compreende, em essência, a identificação do subconjunto das bases de dados existentes que deve ser efetivamente considerado durante o processo de KDD”

A Preparação ou Pré Processamento de dados é o momento em que os dados são preparados para utilizar às técnicas de mineração de dados, Goldschmidt et al. (2015, p.23) exemplifica que “esta etapa tem como objetivo a preparação dos dados para os algoritmos que serão aplicados na etapa de mineração de dados”.

Próxima etapa é a Limpeza dos Dados, em que é realizado o tratamento nos dados para ter corretude dos dados coletados, é a fase em que os dados não corretos são excluídos, Castro e Ferrari (2016, p36) explanam:” a limpeza dos dados atua no sentido de imputar valores ausentes, suavizar ruídos, identificar valores discrepantes (outliers) e corrigir inconsistências”.

Transformação do Dados, os dados são formatados, para que os algoritmos de Data Mining, possam ser aplicados.

Mineração de Dados, ocorre o processamento dos dados, para que se possa identificar as informações importantes nas Bases de Dados, é nesta etapa em que os algoritmos e as técnicas de mineração de dados são aplicados[...}

Avaliação ou Validação de conhecimento, são os resultados encontrados no processo da Mineração de Dados, essa última etapa se preocupa em verificar se algum conhecimento útil foi descoberto, mostrando a importância dos dados descobertos. Essa etapa tem a finalidade de observar os conhecimentos obtidos são: verdadeiros, úteis e não triviais (CASTRO; FERRARI, 2016)

Fonte: http://repositorio.aee.edu.br/jspui/bitstream/aee/53/3/TCC2_2017_02_TatianeGomes.pdf

As principais tarefas de pré-processamento são:

Limpeza: para imputação de valores ausentes, remoção de ruídos e correção de inconsistências;

Integração: para unir dados de múltiplas fontes em um único local, como um armazém de dados (data warehouse);

Redução: para reduzir a dimensão da base de dados, por exemplo, agrupando ou eliminando atributos redundantes, ou para reduzir a quantidade de objetos da base, sumarizando os dados;

Transformação: para padronizar e deixar os dados em um formato passível de aplicação das diferentes técnicas de mineração;

Discretização: para permitir que métodos que trabalham apenas com atributos nominais possam ser empregados a um conjunto maior de problemas.

O objetivo das técnicas de pré-processamento de dados é preparar os dados brutos para serem analisados sem erros de incompletudes, inconsistências e ruídos. E também visa diminuir a quantidade de dados que serão analisados, por meio da aplicação de filtros e de eliminadores de palavras.

Clique para visualizar este comentário

Visualize os comentários desta questão clicando no botão abaixo