Mineração de dados é a investigação de relações e padrões gl...

Próximas questões
Com base no mesmo assunto
Q356036 Banco de Dados
Mineração de dados é a investigação de relações e padrões globais que existem em grandes bancos de dados, mas que estão ocultos no grande volume de dados. Com base nas funções que executam, há diferentes técnicas para a mineração de dados, dentre as quais estão:

I. identificar afinidades existentes entre um conjunto de itens em um dado grupo de registros. Por exemplo: 75% dos envolvidos em processos judiciais ligados a ataques maliciosos a servidores de dados também estão envolvidos em processos ligados a roubo de dados sigilosos.

II. identificar sequências que ocorrem em determinados registros. Por exemplo: 32% de pessoas do sexo feminino após ajuizarem uma causa contra o INSS solicitando nova perícia médica ajuízam uma causa contra o INSS solicitando ressarcimento monetário.

III. as categorias são definidas antes da análise dos dados. Pode ser utilizada para identificar os atributos de um determinado grupo que fazem a discriminação entre 3 tipos diferentes, por exemplo, os tipos de processos judiciais podem ser categorizados como infrequentes, ocasionais e frequentes.

Os tipos de técnicas referenciados em I, II e III, respectivamente, são:
Alternativas

Gabarito comentado

Confira o gabarito comentado por um dos nossos professores

A alternativa correta é a C, que corresponde a:

  • I - Associação: Esta técnica é utilizada para identificar regras de associação entre itens em um conjunto de dados. Um exemplo clássico é a análise de cestas de mercado, onde se busca entender quais produtos são frequentemente comprados juntos. No contexto do enunciado, isso se aplica ao exemplo dos envolvidos em processos judiciais ligados a ataques maliciosos que também estão envolvidos em processos ligados a roubo de dados sigilosos.
  • II - Padrões sequenciais: Esta técnica lida com a identificação de padrões sequenciais, ou seja, sequências de eventos ou itens que ocorrem em uma ordem específica. No exemplo dado, a sequência de ações legais contra o INSS após uma solicitação de nova perícia médica e depois um pedido de ressarcimento financeiro é um padrão sequencial.
  • III - Classificação: A classificação é um processo de Data Mining no qual se atribui itens a categorias ou classes pré-definidas. Utilizando a classificação, pode-se categorizar os tipos de processos judiciais, como mencionado no exemplo, em infrequentes, ocasionais e frequentes, baseando-se em características dos dados.

A compreensão de cada técnica de mineração de dados é essencial para resolver esta questão. A mineração de dados abrange um conjunto de técnicas que buscam extrair conhecimento útil de grandes volumes de dados. Cada técnica tem uma função específica e é aplicada de acordo com o tipo de padrão ou conhecimento que se deseja descobrir:

  • Regras de Associação ajudam a descobrir relações entre variáveis em um conjunto de dados.
  • Padrões Sequenciais são úteis para analisar sequências temporais de eventos.
  • A Classificação é aplicada quando se conhece as categorias e se deseja classificar novos dados com base nesse conhecimento prévio.

É importante notar que técnicas como Redes Neurais e Árvores de Decisão também são utilizadas em mineração de dados, mas para finalidades distintas das apresentadas nas afirmações I, II e III. Redes Neurais são excelentes para modelagem preditiva e reconhecimento de padrões complexos, enquanto Árvores de Decisão são uma forma gráfica e algorítmica de tomar decisões e classificar dados.

Clique para visualizar este gabarito

Visualize o gabarito desta questão clicando no botão abaixo

Comentários

Veja os comentários dos nossos alunos

Não precisa nem ver o resto, dá pra matar a questão pelo item II.

"32% de pessoas do sexo feminino após ajuizarem uma causa contra o INSS solicitando nova perícia médica (também) ajuízam uma causa contra o INSS solicitando ressarcimento monetário."

Se teve relação de tempo, ou seja, uma sequência, é sequencial.

Gabarito C.

I - Associação

II - Padrões sequenciais

III - Classificação

Peguei o "gancho dos colegas" em outras questões SIMILARES e acertei pelo fator "TEMPO" exposto no item 2.

Bons estudos.

Já matei pela III - .. quando categorias são pré-definidas antes da análise são Classificações = Aprendizado Supervisionado.

Clique para visualizar este comentário

Visualize os comentários desta questão clicando no botão abaixo