Mineração de dados é a investigação de relações e padrões gl...
I. identificar afinidades existentes entre um conjunto de itens em um dado grupo de registros. Por exemplo: 75% dos envolvidos em processos judiciais ligados a ataques maliciosos a servidores de dados também estão envolvidos em processos ligados a roubo de dados sigilosos.
II. identificar sequências que ocorrem em determinados registros. Por exemplo: 32% de pessoas do sexo feminino após ajuizarem uma causa contra o INSS solicitando nova perícia médica ajuízam uma causa contra o INSS solicitando ressarcimento monetário.
III. as categorias são definidas antes da análise dos dados. Pode ser utilizada para identificar os atributos de um determinado grupo que fazem a discriminação entre 3 tipos diferentes, por exemplo, os tipos de processos judiciais podem ser categorizados como infrequentes, ocasionais e frequentes.
Os tipos de técnicas referenciados em I, II e III, respectivamente, são:
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
A alternativa correta é a C, que corresponde a:
- I - Associação: Esta técnica é utilizada para identificar regras de associação entre itens em um conjunto de dados. Um exemplo clássico é a análise de cestas de mercado, onde se busca entender quais produtos são frequentemente comprados juntos. No contexto do enunciado, isso se aplica ao exemplo dos envolvidos em processos judiciais ligados a ataques maliciosos que também estão envolvidos em processos ligados a roubo de dados sigilosos.
- II - Padrões sequenciais: Esta técnica lida com a identificação de padrões sequenciais, ou seja, sequências de eventos ou itens que ocorrem em uma ordem específica. No exemplo dado, a sequência de ações legais contra o INSS após uma solicitação de nova perícia médica e depois um pedido de ressarcimento financeiro é um padrão sequencial.
- III - Classificação: A classificação é um processo de Data Mining no qual se atribui itens a categorias ou classes pré-definidas. Utilizando a classificação, pode-se categorizar os tipos de processos judiciais, como mencionado no exemplo, em infrequentes, ocasionais e frequentes, baseando-se em características dos dados.
A compreensão de cada técnica de mineração de dados é essencial para resolver esta questão. A mineração de dados abrange um conjunto de técnicas que buscam extrair conhecimento útil de grandes volumes de dados. Cada técnica tem uma função específica e é aplicada de acordo com o tipo de padrão ou conhecimento que se deseja descobrir:
- Regras de Associação ajudam a descobrir relações entre variáveis em um conjunto de dados.
- Padrões Sequenciais são úteis para analisar sequências temporais de eventos.
- A Classificação é aplicada quando se conhece as categorias e se deseja classificar novos dados com base nesse conhecimento prévio.
É importante notar que técnicas como Redes Neurais e Árvores de Decisão também são utilizadas em mineração de dados, mas para finalidades distintas das apresentadas nas afirmações I, II e III. Redes Neurais são excelentes para modelagem preditiva e reconhecimento de padrões complexos, enquanto Árvores de Decisão são uma forma gráfica e algorítmica de tomar decisões e classificar dados.
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
Não precisa nem ver o resto, dá pra matar a questão pelo item II.
"32% de pessoas do sexo feminino após ajuizarem uma causa contra o INSS solicitando nova perícia médica (também) ajuízam uma causa contra o INSS solicitando ressarcimento monetário."
Se teve relação de tempo, ou seja, uma sequência, é sequencial.
Gabarito C.
I - Associação
II - Padrões sequenciais
III - Classificação
Peguei o "gancho dos colegas" em outras questões SIMILARES e acertei pelo fator "TEMPO" exposto no item 2.
Bons estudos.
Já matei pela III - .. quando categorias são pré-definidas antes da análise são Classificações = Aprendizado Supervisionado.
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo