Questões de Concurso
Comentadas sobre data mining em banco de dados
Foram encontradas 416 questões
Embora os algoritmos genéticos apresentem elevada demanda computacional, eles possibilitam a resolução de problemas em paralelo; por isso, são uma boa ferramenta para mineração de dados.
O processo de transformação de dados pode exigir que dados logicamente relacionados, mas fisicamente separados, sejam recompostos, ainda que envolvam registros distintos ou até mesmo estejam em bancos de dados operacionais distintos.
O uso de agrupamento (clustering) em DataMining exige que os registros sejam previamente categorizados, tendo por finalidade aproximar registros similares para predizer valores de variáveis.
A captura de dados baseada na técnica Timestamp é inadequada para capturar estados intermediários, nas situações em que os dados operacionais são transientes.
Os principais processos de DataMining são a identificação de variações embasado em normas, a detecção e análise de relacionamentos, a paginação de memória e o controle de periféricos.
DataMining pode ser considerado uma etapa no processo de descoberta de conhecimento em base de dados, consistindo em análise de conjuntos de dados cujo objetivo é descobrir padrões úteis para tomada de decisão.
Assim como o DataMining, os DataMarts são voltados para a obtenção de informações estratégicas de maneira automática, ou seja, com o mínimo de intervenção humana a partir da análise de dados oriundos de DataWarehouses.
Com o uso da classificação como técnica de Data Mining, busca-se a identificação de uma classe por meio de múltiplos atributos. Essa técnica também pode ser usada em conjunto com outras técnicas de mineração de dados.
1. Ferramentas de Data Mining podem ser utilizadas independentemente do Data Warehouse, mas obtêm-se melhores resultados quando aplicadoasde forma conjunta.
2. Técnicas de Clusterização podem ser utilizadas na extração e na preparação de dados de um banco de dados para um Data Warehouse.
3. Data Mining é uma evolução do conceito de Data Warehouse.
4. A mineração de dados baseia-se na utilização de algoritmos capazes de analisar grandes bases de dados de modo efciente e revelar padrões interessantes, escondidos nos dados.
Assinale a alternativa que indica todas as afrmativas corretas.
I. identificar afinidades existentes entre um conjunto de itens em um dado grupo de registros. Por exemplo: 75% dos envolvidos em processos judiciais ligados a ataques maliciosos a servidores de dados também estão envolvidos em processos ligados a roubo de dados sigilosos.
II. identificar sequências que ocorrem em determinados registros. Por exemplo: 32% de pessoas do sexo feminino após ajuizarem uma causa contra o INSS solicitando nova perícia médica ajuízam uma causa contra o INSS solicitando ressarcimento monetário.
III. as categorias são definidas antes da análise dos dados. Pode ser utilizada para identificar os atributos de um determinado grupo que fazem a discriminação entre 3 tipos diferentes, por exemplo, os tipos de processos judiciais podem ser categorizados como infrequentes, ocasionais e frequentes.
Os tipos de técnicas referenciados em I, II e III, respectivamente, são:
Em se tratando de mineração de dados, a técnica de agrupamento (clustering) permite a descoberta de dados por faixa de valores, por meio do exame de alguns atributos das entidades envolvidas.
As tecnologias de bancos da dados, data mining e data warehouse têm sido utilizadas plenamente para a monitoração de ambientes operacionais, pois utilizam ontologias e inteligência artificial com agilidade e baixo custo operacional.
O data mining é um processo utilizado para a extração de dados de grandes repositórios para tomada de decisão, mas sua limitação é não conseguir analisar dados de um data warehouse.
Os dados podem provir de diferentes modelos de dados, mas devem ser integrados em um modelo integrado antes de serem armazenados em um datawarehouse.
A fase de modelagem de um data mining agrega a seleção e aplicação das técnicas sobre os dados selecionados. Inúmeras técnicas podem ser empregadas para obtenção de padrões úteis, como por exemplo, a PMML (predictive model markup language), que objetiva, via schemas XML, a definição para modelos encontrados em associações, modelos de regressão e clustering.