Questões de Concurso
Comentadas sobre data mining em banco de dados
Foram encontradas 416 questões
Além dos indicadores reativos que, uma vez implantados, automaticamente detectam as ocorrências com base nos indicadores mapeados, existem também os controles proativos, que requerem que os gestores os promovam periodicamente. Uma das técnicas que os gestores podem usar requer que sejam selecionadas, exploradas e modeladas grandes quantidades de dados para revelar padrões, tendências e relações que podem ajudar a identificar casos de fraude e corrupção. Relações ocultas entre pessoas, entidades e eventos são identificadas e as relações suspeitas podem ser encaminhadas para apuração específica. As anomalias apontadas por esse tipo de técnica não necessariamente indicam a ocorrência de fraude e corrupção, mas eventos singulares que merecem avaliação individualizada para a exclusão da possibilidade de fraude e corrupção e, no caso da não exclusão, uma investigação.
(Adaptado de: TCU - Tribunal de Contas da União)
O texto se refere à técnica de
“A Secretaria da Fazenda realizou procedimento que visa estimular os contribuintes paulistas a, voluntariamente, regularizarem as obrigações tributárias que devem ser transmitidas ao Fisco. Em uma etapa da operação foram selecionados 48 contribuintes do Regime Periódico de Apuração com R$ 143 milhões em débitos de ICMS.
Esta ação tem caráter orientador, com o objetivo de alertar as empresas sobre divergências em suas declarações e indicar a regularização, porém, a ação pode resultar em indicações de empresas de fachada que apresentaram um conjunto de indícios que sugerem tratar-se de documentos fiscais inidôneos ou de simulação de operações para gerar créditos falsos de ICMS na apuração mensal do tributo a recolher.
Para a elaboração da operação autorregularização foram selecionados contribuintes com divergências nas notas fiscais emitidas entre janeiro a dezembro de 2016 em comparação com as informações declaradas nas Guias de Informação e Apuração do ICMS do mesmo período."
(Baseado em: https://portal.fazenda.sp.gov.br)
Ao ler esta notícia, uma Auditora Fiscal da área de TI concluiu, corretamente, que o cruzamento e a análise simultânea de diversas informações, como Nota Fiscal Eletrônica (NF-e), inadimplência, regularidade no cumprimento de obrigações, porte da empresa, composição do quadro societário, autos de infração anteriores, localização geográfica e atividade econômica, entre outras,
Castro e Ferrari (2016) mencionam que as funcionalidades da mineração de dados são utilizadas para especificar os tipos de informação a serem obtidos nas tarefas de mineração. Sobre esse tema, considere as seguintes funcionalidades:
1. Análise de grupos: tarefa supervisionada que separa um conjunto de objetos em grupos.
2. Classificação: tarefa supervisionada para predição de valores discretos.
3. Regressão (ou estimação): tarefa supervisionada para predição de valores contínuos.
4. Associação: tarefa que descobre relações entre atributos por meio da detecção de anomalias nos conjuntos de dados.
É/São funcionalidade(s) da etapa de mineração:
Rafael aplicou um teste de múltipla escolha de cem questões para um numeroso grupo de alunos e notou que houve uma variada distribuição de notas.
Rafael resolveu trabalhar esses dados, e agrupar esses alunos de modo que cada um ficasse no grupo mais adequado para a sua nota. Assim, poderia preparar atividades específicas para cada grupo.
Assinale a opção que indica o algoritmo mais adequado para essa tarefa.
Julgue o item a seguir, a respeito de data mining e OLAP.
No data mining, uma regra de associação relaciona a presença
de um conjunto de itens com outra faixa de valores de um
outro conjunto de variáveis.
Atenção: Para responder à questão, considere o seguinte caso hipotético:
Um Auditor da Receita Estadual pretende descobrir, após denúncia, elementos que possam caracterizar e fundamentar a possível existência de fraudes, tipificadas como sonegação tributária, que vêm ocorrendo sistematicamente na arrecadação do ICMS. A denúncia é que, frequentemente, caminhões das empresas Org1, Org2 e Org3 não são adequadamente fiscalizados nos postos de fronteiras. Inobservâncias de procedimentos podem ser avaliadas pelo curto período de permanência dos caminhões dessas empresas na operação de pesagem, em relação ao período médio registrado para demais caminhões.
Para caracterizar e fundamentar a existência de possíveis fraudes, o Auditor deverá coletar os registros diários dos postos por, pelo menos, 1 ano e elaborar demonstrativos para análises mensais, trimestrais e anuais.
O cálculo do valor esperado provê um framework que é extremamente útil para organizar o pensamento sobre problemas envolvendo análise de dados (data-analytic).
PROVOST, F.; FAWCETT, T. Data Science for Business: What you need to know about data mining and data-analytic thinking. O'Reilly Media, 2013, tradução livre.
O valor esperado pode ser representado matematicamente por
Os benefícios de um modelo de tomada de decisões com base em dados (DDD, do inglês data-driven decisionmaking) já foram demonstrados conclusivamente. O economista Erik Brynjolfsson e seus colegas do MIT e Wharton conduziram estudos sobre como DDD afeta a performance de uma empresa.
PROVOST, F.; FAWCETT, T. Data Science for Business: What you need to know about data mining and data-analytic thinking. O'Reilly Media, 2013, tradução livre.
Com base nessas informações, é correto afirmar que DDD se
refere à pratica de
Um desenvolvedor recebeu um conjunto de dados representando o perfil de um grupo de clientes, sem nenhuma informação do tipo de cada cliente, onde cada um era representado por um conjunto fixo de atributos, alguns contínuos, outros discretos. Exemplos desses atributos são: idade, salário e estado civil. Foi pedido a esse desenvolvedor que, segundo a similaridade entre os clientes, dividisse os clientes em grupos, sendo que clientes parecidos deviam ficar no mesmo grupo. Não havia nenhuma informação que pudesse ajudar a verificar se esses grupos estariam corretos ou não nos dados disponíveis para o desenvolvedor.
Esse é um problema de data mining conhecido, cuja solução mais adequada é um algoritmo
Situação hipotética: Na ação de obtenção de informações por meio de aprendizado de máquina, verificou-se que o processo que estava sendo realizado consistia em examinar as características de determinado objeto e atribuir-lhe uma ou mais classes; verificou-se também que os algoritmos utilizados eram embasados em algoritmos de aprendizagem supervisionados. Assertiva: Nessa situação, a ação em realização está relacionada ao processo de classificação.
Considerando essas informações, julgue o item que segue.
Se um sistema de informação correlaciona os dados da tabela
em questão com outros dados não estruturados, então, nesse
caso, ocorre um processo de mineração de dados.
Tendo como referência as informações apresentadas, julgue o item seguinte.
Pelo monitoramento do tráfego de rede no acesso ao sítio em questão, uma aplicação que utiliza machine learning é capaz de identificar, por exemplo, que os acessos diminuíram 20% em relação ao padrão de acesso em horário específico do dia da semana.