Com referência aos conceitos e técnicas de mineração de dado...
Com referência aos conceitos e técnicas de mineração de dados, julgue o item seguinte.
Para encontrar regras de associação negativas de interesse,
como a identificação de padrões nos dados de um arquivo, a
hierarquia é uma técnica usada com base no conhecimento
prévio sobre um conjunto de atributos do arquivo.
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
Gabarito: C - Certo
No contexto de Data Mining ou Mineração de Dados, a busca por regras de associação é uma técnica chave. Isso envolve descobrir relações interessantes e freqüentemente ocultas, padrões ou tendências dentro de grandes conjuntos de dados. As regras de associação não se limitam a correlações positivas, mas também podem identificar associações negativas, que são relações onde a ocorrência de um item ou um conjunto de itens é negativamente correlacionada com outro item ou conjunto de itens.
Para realizar essa análise de maneira eficaz, é comum utilizar-se do conhecimento prévio sobre os dados. Isso é feito através de uma hierarquia, que organiza e categoriza os dados em diferentes níveis de abstração. Essas categorizações podem auxiliar no processo de mineração ao reduzir a complexidade dos dados e permitir que a análise se concentre em níveis mais gerais ou específicos, conforme necessário.
Portanto, a afirmativa está correta ao mencionar que, para encontrar regras de associação negativas, a hierarquia é uma técnica utilizada com base no conhecimento prévio sobre um conjunto de atributos do arquivo. Esse conhecimento prévio é fundamental para estruturar a análise de dados de modo a revelar insights valiosos, inclusive na identificação de padrões que indicam associações negativas.
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
CERTO
Elmasri e navathe, 2011, pg 1007:
"para tornar as regras de associação negativas interessantes, temos de usar o conhecimento prévio sobre os conjuntos de itens. Uma das técnicas é empregar hierarquias"
Para complementar o comentário da Rafaella.
A regra de associação negativa em bancos de dados refere-se à identificação de relações inversas entre itens, ou seja, quando a presença de um item implica na ausência de outro.
O que são Regras de Associação?
Imagine um supermercado que quer entender os hábitos de compra dos seus clientes. Eles analisam os carrinhos de compras e notam, por exemplo, que muitas vezes quem compra pão também compra manteiga. Isso é uma regra de associação: "Se compra pão, então provavelmente compra manteiga". A IA usa algoritmos para encontrar essas relações automáticas em grandes conjuntos de dados.
Regras de Associação Negativas:
As regras negativas são o oposto. Elas mostram o que não costuma ser comprado junto. Por exemplo: "Quem compra arroz integral, geralmente não compra refrigerante".
O Problema das Regras Negativas Óbvias:
O problema é que a IA, sem ajuda, pode encontrar regras negativas muito óbvias, que não nos dão nenhuma informação útil. Por exemplo: "Quem compra fraldas, geralmente não compra cerveja". Isso é óbvio, pois são produtos para públicos diferentes. Essas regras não são "interessantes".
Usando Conhecimento Prévio e Hierarquias:
Para encontrar regras negativas interessantes, precisamos dar à IA algum "conhecimento prévio" sobre os produtos. Uma forma de fazer isso é usar hierarquias.
Uma hierarquia é uma forma de organizar as coisas em categorias. No exemplo do supermercado, podemos ter as seguintes hierarquias:
- Bebidas: Refrigerantes, Sucos, Água, Cerveja, etc.
- Alimentos:Grãos: Arroz, Feijão, etc.
- Laticínios: Leite, Queijo, Manteiga, etc.
- Bebê: Fraldas, Leite em pó, etc.
Com essas hierarquias, a IA entende que "refrigerante" e "cerveja" são ambos "Bebidas". Assim, a regra "Quem compra fraldas, geralmente não compra cerveja" se torna menos interessante, pois já sabemos que quem compra produtos para bebês provavelmente não compra bebidas alcoólicas.
Um Exemplo Mais Interessante:
Com a hierarquia, a IA pode encontrar regras mais sutis, como: "Quem compra arroz integral (um tipo específico de grão), geralmente não compra refrigerantes com açúcar (um tipo específico de bebida)". Essa regra é mais interessante porque relaciona categorias mais específicas dentro das hierarquias, revelando uma possível preferência por alimentos mais saudáveis.
Em resumo:
- Regras de associação mostram o que costuma ser comprado junto.
- Regras de associação negativas mostram o que não costuma ser comprado junto.
- Para que as regras negativas sejam úteis, precisamos dar à IA algum contexto, usando hierarquias para organizar os dados. Isso evita que a IA encontre regras óbvias e nos ajuda a descobrir relações mais interessantes e úteis.
Portanto, a afirmação de que "para tornar as regras de associação negativas interessantes, temos de usar o conhecimento prévio sobre os conjuntos de itens. Uma das técnicas é empregar hierarquias" significa que, ao organizar os dados em categorias (hierarquias), fornecemos um contexto para a IA, permitindo que ela encontre padrões negativos mais relevantes e informativos, em vez de apenas constatar obviedades.
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo