Questões de Concurso Comentadas sobre data mining em banco de dados

Foram encontradas 416 questões

Q2078032 Banco de Dados

No que diz respeito ao modelo de referência CRISP-DM (Cross Industry Standard Process for Data Mining), julgue o item.

A única desvantagem que impede o uso em larga escala do CRISP-DM é o seu alto custo, uma vez que os usuários somente podem utilizá-lo após a aquisição da licença. 

Alternativas
Q2078031 Banco de Dados

No que diz respeito ao modelo de referência CRISP-DM (Cross Industry Standard Process for Data Mining), julgue o item.

O CRISP-DM é uma metodologia abrangente de mineração de dados e um modelo de processo que fornece, para os usuários de data mining (DM), um modelo completo para a realização de um projeto de DM. 

Alternativas
Q2066826 Banco de Dados
Sobre detecção de anomalias, analise as afirmativas a seguir.
I. São exemplos de detecção de anomalias: detecção de fraude, detecção de intrusão, monitoramento de sistemas de saúde, qualidade de um produto. II. São métodos que conseguem lidar com detecção de anomalias: algoritmos baseados em densidade, análise de agrupamento, redes neurais recorrentes, redes bayesianas e modelos de Markov escondidos. III. A distribuição normal é a distribuição mais comum dos dados considerados dentro de uma normalidade, porém, podemos obter normalidade também por meio de outros tipos de distribuição como a distribuição de Bernoulli, distribuição uniforme, distribuição binomial e distribuição de Minkowski. IV. A métrica de avaliação desses métodos pode ajudar na identificação de dados fora do padrão. Portanto, as métricas de precisão, sensibilidade e medida-F1 são exemplos de métricas utilizadas para detecção de anomalias.
Está correto o que se afirma em
Alternativas
Q2020855 Banco de Dados
Julgue o item a seguir, a respeito do conceito de data lake
     O termo data lake é usado para se referir a uma arquitetura em que os dados são armazenados em vários sistemas de armazenamento de dados e em diferentes formatos, inclusive em sistemas de arquivos, mas podem ser consultados em um único sistema.
Alternativas
Q2010313 Banco de Dados
No contexto de Business Intelligence (BI) pode-se descobrir interesses de cunho político dos cidadãos pelo perfil de cada um, categorizando-os por faixa etária, escolaridade, poder aquisitivo ou outras particularidades típicas. A captura dos perfis pode ser feita, por exemplo, por meio de uma aplicação Web que desperte o interesse de acesso ao conteúdo do site pelos cidadãos em troca do fornecimento de seus dados pessoais, tornando possível realizar cruzamentos e associações desses dados e então tomar decisões a respeito. Esse processo refere-se a uma aplicação típica da tecnologia denominada
Alternativas
Q2005974 Banco de Dados
Nas questões que avaliem conhecimentos de informática, a menos que seja explicitamente informado o contrário, considere que: todos os programas mencionados estejam em configuração-padrão, em português; o mouse esteja configurado para pessoas destras; expressões como clicarclique simples e clique duplo refiram-se a cliques com o botão esquerdo do mouse; e teclar corresponda à operação de pressionar uma tecla e, rapidamente, liberá-la, acionando-a apenas uma vez. Considere também que não haja restrições de proteção, de funcionamento e de uso em relação aos programas, arquivos, diretórios, recursos e equipamentos mencionados. 

No DataMining, a função de pré-processamento que consiste em conseguir, de alguma forma, mais informação que possa ser agregada aos registros existentes, para que estes forneçam mais informações para o processo de descoberta de conhecimento, é o(a) 
Alternativas
Q1993175 Banco de Dados
No contexto da implementação de tecnologias para data mining e apresentação de dados, a sigla ETL refere-se 
Alternativas
Q1985594 Banco de Dados
Em muitos problemas reais, os dados contêm classes majoritárias e minoritárias. Por exemplo, ao se analisar dados sobre fraudes em bancos, é mais provável que os conjuntos de dados contenham poucos dados de fraude e muitos de não fraude. Ao dividir o conjunto de dados em conjunto de treinamento e conjunto de teste para avaliar um modelo de classificação, qual técnica garante que o conjunto de teste tenha elementos da classe minoritária?
Alternativas
Q1970474 Banco de Dados
Considere que o Tribunal Regional do Trabalho utiliza o modelo de referência CRISP-DM (Cross Industry Standard Process for Data Mining). Em um certo momento, uma equipe de Analistas está discutindo as seguintes questões relativas a um projeto:
− Qual formato de data será utilizado: dd/mm/aaaa ou mm/dd/aaaa?
− Os dados advindos das diversas fontes, relativos a um mesmo conteúdo, são compatíveis entre si?
− Os campos binários serão formatados com True e False ou terão que ser convertidos para 1 e 0?
− Após as análises descritivas, a média, a mediana, a moda e a quantidade dos dados estão de acordo com as categorias definidas?
Com base nas questões apresentadas, a equipe está trabalhando na etapa do CRISP-DM denominada
Alternativas
Q1966257 Banco de Dados
Leia o fragmento a seguir.
“A tarefa de detecção de anomalias é um caso particular de problema de _____, onde a quantidade de objetos da classe alvo (anomalia) é muito inferior à quantidade de objetos da classe normal e, adicionalmente, o custo da não detecção de uma anomalia (_____) é normalmente muito maior do que identificar um objeto normal como uma anomalia (_____)”
Assinale a opção cujos itens completam corretamente as lacunas do fragmento acima, na ordem apresentada. 
Alternativas
Q1966256 Banco de Dados
Com relação ao algoritmo de K-Means, analise as afirmativas a seguir e assinale (V) para a verdadeira e (F) para a falsa.

( ) Consiste em fixar k centroides de modo quadrático, sendo um para cada novo cluster.
( ) Associa cada indivíduo ao centroide do seu vizinho, obtido pelo cálculo da minimização da soma quadrática das distâncias entre os dados e os centroides mais próximos.
( ) Recalcula os centroides com base nos indivíduos classificados.

As afirmativas são, na ordem apresentada, respectivamente, 
Alternativas
Q1965840 Banco de Dados
Criada na década de 90, a expressão Data Mining serve para definirmos a área de estudo de dados focada na aquisição de conhecimento a partir destes dados. Essa área conta com o apoio de outras áreas de estudo, como por exemplo a estatística e a inteligência artificial. Marque a alternativa que indica, corretamente, o nome do tipo de problema que Data Mining é capaz de resolver e que é um caso especifico de problemas de classificação.  
Alternativas
Q1963307 Banco de Dados

Quais tipos de conhecimento podem ser descobertos empregando técnicas clássicas de mineração de dados?


1. Regras de Associação

2. Hierarquias de classificação

3. Padrões sequenciais ou de série temporal

4. Conhecimento implícito, emergente e não estruturado

5. Agrupamentos e segmentações


Assinale a alternativa que indica todas as afirmativas corretas.

Alternativas
Q1962675 Banco de Dados

Uma regra de associação utilizada em mineração de dados é uma expressão de implicação no formato X → Y, onde X e Y são conjuntos disjuntos de itens, onde X ∩ Y = Ø. A força de uma regra de associação pode ser medida em termos do seu suporte (sup) e confiança (conf).


Assinale a opção que apresenta a definição formal da métrica confiança.

Alternativas
Q1962668 Banco de Dados

Leia o fragmento a seguir.


“Atualmente, no contexto do Big Data e Data Analytics, faz-se referência às características enunciadas por pesquisadores e produtores de soluções como sendo um conjunto de cinco Vs. Originalmente, a definição clássica de Big Data fez referência a três Vs fundamentais: _____, _____ e _____ de dados que demandam formas inovadoras e rentáveis de processamento da informação, para melhor percepção e tomada de decisão.”


Assinale a opção cujos itens completam corretamente as lacunas do fragmento acima, na ordem apresentada.

Alternativas
Q1962636 Banco de Dados

A mineração de dados (Data Mining) envolve um conjunto de algoritmos e ferramentas que são utilizados para a exploração de dados.


Assinale o algoritmo/método usado na extração de regras de associação.

Alternativas
Q1961937 Banco de Dados

Leia o fragmento a seguir.


“CRISP-DM é um modelo de referência não proprietário, neutro, documentado e disponível na Internet, sendo amplamente utilizado para descrever o ciclo de vida de projetos de Ciência de Dados. O modelo é composto por seis fases: 1. entendimento do negócio; 2. _____; 3. _____; 4. Modelagem; 5. _____ ; e 6. implantação”.


Assinale a opção cujos itens completam corretamente as lacunas do fragmento acima, na ordem apresentada.

Alternativas
Q1961654 Banco de Dados
No que diz respeito aos dados estruturados e não estruturados, aos bancos de dados relacionais, ao modelo de referência CRISP-DM e à modelagem preditiva, julgue o item seguinte.  

No início de um processo de descoberta de conhecimento em bases de dados (KDD), o CRISP-DM recomenda, em relação ao levantamento do hardware existente, que o processo de KDD seja realizado em plataforma com arquitetura não expansível, que forneça suporte e acesso somente à base de dados homogênea. 
Alternativas
Q1960010 Banco de Dados
Julgue o item, referente à modelagem dimensional, ao modelo de referência CRISP-DM e à mineração de dados. 
O uso da mineração de dados permite, por exemplo, que as empresas mais bem planejem a logística de distribuição dos seus produtos, prevendo picos nas vendas. 
Alternativas
Q1960009 Banco de Dados
Julgue o item, referente à modelagem dimensional, ao modelo de referência CRISP-DM e à mineração de dados. 
O modelo de referência CRISP-DM, composto por quatro fases não cíclicas, permite o fluxo unidirecional, ou seja, pode ir e voltar entre as fases. 
Alternativas
Respostas
101: E
102: C
103: D
104: C
105: D
106: D
107: D
108: D
109: E
110: D
111: D
112: D
113: C
114: D
115: D
116: A
117: D
118: E
119: C
120: E