Processo de explorar grandes quantidades de dados à ...
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
Alternativa correta: C - mineração de dados (data mining).
A mineração de dados, ou data mining, refere-se ao processo analítico projetado para explorar grandes quantidades de dados (big data) em busca de padrões, tendências ou regras consistentes que possam explicar o comportamento dos dados e prever fenômenos futuros. Esse processo envolve métodos de inteligência artificial, aprendizado de máquina, estatística e sistemas de banco de dados para encontrar correlações ou padrões entre variáveis em grandes conjuntos de dados.
Na prática, esses padrões podem se manifestar como regras de associação, sequências temporais, clusters, entre outros modelos preditivos e descritivos. A mineração de dados é amplamente utilizada em diversas áreas, como marketing, medicina, biologia, engenharia, entre outras, para auxiliar na tomada de decisões e na descoberta de conhecimento relevante escondido nos dados.
Para identificar a alternativa correta, conhecimentos básicos sobre os conceitos de banco de dados e análise de dados são essenciais, bem como a compreensão das diferenças entre ferramentas e técnicas utilizadas no gerenciamento e processamento de dados. Compreender que data mining está diretamente associado ao processo de descobrimento de informações úteis em grandes conjuntos de dados é chave para resolver essa questão.
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
Os dados estão disponíveis somente para leitura e não podem ser alterados. O Data Warehouse é um banco de dados multidimensional grande, de escopo organizacional (ou seja, abrange toda a empresa) e reúne dados de todos os departamentos de forma a permitir a busca rápida de informações para auxiliar a tomada de decisões estratégicas. A principal ideia do Data Warehouse é construir um depósito no qual será mantida a memória histórica dos dados, possibilitando a utilização dos mesmos para consulta e análise estratégica para a tomada de decisão. A ferramenta mais popular para exploração de um data warehouse é a Online Analytical Processing OLAP ou Processo Analítico em Tempo Real, mas muitas outras podem ser usadas.
- Data Mart: é um banco de dados multidimensional de escopo departamental (ou seja, abrange apenas um determinado departamento). “Um subconjunto lógico do Data Warehouse, geralmente visto como um data warehousesetorial” (Kimball). As diferenças entre o Data Mart e o Data Warehouse são apenas com relação ao tamanho e ao escopo do problema a ser resolvido.
- Data Mining (ou Mineração de dados): define uma série de procedimentos, técnicas e ferramentas para recuperar e analisar dados de um Data Warehouse ou Data Mart à procura de padrões e tendências a respeito dos dados armazenados. Processo de analisar de maneira semi-automática grandes bancos de dados para encontrar padrões úteis. Objetivos do Data Mining: conhecer o comportamento de certos atributos no futuro; possibilitar a análise de determinados padrões de eventos; categorizar perfis individuais ou coletivos de interesse comercial; apoiar a otimização do uso de recursos limitados e/ou maximizar variáveis de resultado para a empresa. As técnicas mais conhecidas de Data Mining (que também são chamadas de tarefas, por alguns autores) são: Descrição de Classes, Associação, Classificação, Previsão e Agrupamento (também conhecida como “clustering”). Alia-se a estas técnicas ainda, algumas ferramentas estatísticas como Regressão Linear, Modelo Linear Generalizado e Análise de Correlação.
Fiquem com Deus!
Segundo Navathe(2011,p.698),"Como o termo indica, mineração de dados refere-se à mineração ou descoberta de novas informações em termos de padrões ou regras com base em grandes quantidades de dados."
Segundo Navathe(2011,p.700),"É comum descrever o conhecimento descoberto durante a mineração de dados da seguinte forma: regras de associação, hierarquias de classificação, padrões sequenciais, padrões dentro de série temporal e agrupamento."
Bibliografia:
SISTEMAS DE BANCO DE DADOS. 6 EDIÇÃO 2011. NAVATHE
Peço licença e replico comentário para melhor visualização.
Data Warehouse: coleção de dados orientados por assuntos, integrados, variáveis com o tempo e não voláteis, para dar suporte ao processo de tomada de decisão.
O Data Warehouse possibilita a análise de grandes volumes de dados, coletados dos sistemas transacionais (OLTP).
São as chamadas séries históricas que possibilitam uma melhor análise de eventos passados, oferecendo suporte às tomadas de decisões presentes e a previsão de eventos futuros. Por definição, os dados em um data warehouse não são voláteis, ou seja, eles não mudam, salvo quando é necessário fazer correções de dados previamente carregados.
A ferramenta mais popular para exploração de um data warehouse é a Online Analytical Processing OLAP ou Processo Analítico em Tempo Real, mas muitas outras podem ser usadas.
Data Mart: é um banco de dados multidimensional de escopo departamental (ou seja, abrange apenas um determinado departamento).
“Um subconjunto lógico do Data Warehouse, geralmente visto como um data warehouse setorial” (Kimball).
As diferenças entre o Data Mart e o Data Warehouse são apenas com relação ao tamanho e ao escopo do problema a ser resolvido.
Data Mining (ou Mineração de dados): define uma série de procedimentos, técnicas e ferramentas para recuperar e analisar dados de um Data Warehouse ou Data Mart à procura de padrões e tendências a respeito dos dados armazenados.
Processo de analisar de maneira semi-automática grandes bancos de dados para encontrar padrões úteis.
Objetivos do Data Mining:
* conhecer o comportamento de certos atributos no futuro;
* possibilitar a análise de determinados padrões de eventos;
* categorizar perfis individuais ou coletivos de interesse comercial;
* apoiar a otimização do uso de recursos limitados e/ou maximizar variáveis de resultado para a empresa.
As técnicas mais conhecidas de Data Mining são: Descrição de Classes, Associação, Classificação, Previsão e Agrupamento (também conhecida como “clustering”).
Alia-se a estas técnicas ainda, algumas ferramentas estatísticas como Regressão Linear, Modelo Linear Generalizado e Análise de Correlação.
As palavras-chave para nos ajudar: explorar dados; procurar padrões consistentes; detectar relacionamentos sistemáticos; novos subconjuntos de dados – tudo isso nos remete ao processo de Mineração de Dados (Data Mining).
Fonte: pdf- estratégia concursos
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo