Questões de Concurso Sobre data mining em banco de dados

Foram encontradas 451 questões

Q2010313 Banco de Dados
No contexto de Business Intelligence (BI) pode-se descobrir interesses de cunho político dos cidadãos pelo perfil de cada um, categorizando-os por faixa etária, escolaridade, poder aquisitivo ou outras particularidades típicas. A captura dos perfis pode ser feita, por exemplo, por meio de uma aplicação Web que desperte o interesse de acesso ao conteúdo do site pelos cidadãos em troca do fornecimento de seus dados pessoais, tornando possível realizar cruzamentos e associações desses dados e então tomar decisões a respeito. Esse processo refere-se a uma aplicação típica da tecnologia denominada
Alternativas
Q2005974 Banco de Dados
Nas questões que avaliem conhecimentos de informática, a menos que seja explicitamente informado o contrário, considere que: todos os programas mencionados estejam em configuração-padrão, em português; o mouse esteja configurado para pessoas destras; expressões como clicarclique simples e clique duplo refiram-se a cliques com o botão esquerdo do mouse; e teclar corresponda à operação de pressionar uma tecla e, rapidamente, liberá-la, acionando-a apenas uma vez. Considere também que não haja restrições de proteção, de funcionamento e de uso em relação aos programas, arquivos, diretórios, recursos e equipamentos mencionados. 

No DataMining, a função de pré-processamento que consiste em conseguir, de alguma forma, mais informação que possa ser agregada aos registros existentes, para que estes forneçam mais informações para o processo de descoberta de conhecimento, é o(a) 
Alternativas
Q1993175 Banco de Dados
No contexto da implementação de tecnologias para data mining e apresentação de dados, a sigla ETL refere-se 
Alternativas
Q1985594 Banco de Dados
Em muitos problemas reais, os dados contêm classes majoritárias e minoritárias. Por exemplo, ao se analisar dados sobre fraudes em bancos, é mais provável que os conjuntos de dados contenham poucos dados de fraude e muitos de não fraude. Ao dividir o conjunto de dados em conjunto de treinamento e conjunto de teste para avaliar um modelo de classificação, qual técnica garante que o conjunto de teste tenha elementos da classe minoritária?
Alternativas
Q1970474 Banco de Dados
Considere que o Tribunal Regional do Trabalho utiliza o modelo de referência CRISP-DM (Cross Industry Standard Process for Data Mining). Em um certo momento, uma equipe de Analistas está discutindo as seguintes questões relativas a um projeto:
− Qual formato de data será utilizado: dd/mm/aaaa ou mm/dd/aaaa?
− Os dados advindos das diversas fontes, relativos a um mesmo conteúdo, são compatíveis entre si?
− Os campos binários serão formatados com True e False ou terão que ser convertidos para 1 e 0?
− Após as análises descritivas, a média, a mediana, a moda e a quantidade dos dados estão de acordo com as categorias definidas?
Com base nas questões apresentadas, a equipe está trabalhando na etapa do CRISP-DM denominada
Alternativas
Q1966257 Banco de Dados
Leia o fragmento a seguir.
“A tarefa de detecção de anomalias é um caso particular de problema de _____, onde a quantidade de objetos da classe alvo (anomalia) é muito inferior à quantidade de objetos da classe normal e, adicionalmente, o custo da não detecção de uma anomalia (_____) é normalmente muito maior do que identificar um objeto normal como uma anomalia (_____)”
Assinale a opção cujos itens completam corretamente as lacunas do fragmento acima, na ordem apresentada. 
Alternativas
Q1966256 Banco de Dados
Com relação ao algoritmo de K-Means, analise as afirmativas a seguir e assinale (V) para a verdadeira e (F) para a falsa.

( ) Consiste em fixar k centroides de modo quadrático, sendo um para cada novo cluster.
( ) Associa cada indivíduo ao centroide do seu vizinho, obtido pelo cálculo da minimização da soma quadrática das distâncias entre os dados e os centroides mais próximos.
( ) Recalcula os centroides com base nos indivíduos classificados.

As afirmativas são, na ordem apresentada, respectivamente, 
Alternativas
Q1965840 Banco de Dados
Criada na década de 90, a expressão Data Mining serve para definirmos a área de estudo de dados focada na aquisição de conhecimento a partir destes dados. Essa área conta com o apoio de outras áreas de estudo, como por exemplo a estatística e a inteligência artificial. Marque a alternativa que indica, corretamente, o nome do tipo de problema que Data Mining é capaz de resolver e que é um caso especifico de problemas de classificação.  
Alternativas
Q1963307 Banco de Dados

Quais tipos de conhecimento podem ser descobertos empregando técnicas clássicas de mineração de dados?


1. Regras de Associação

2. Hierarquias de classificação

3. Padrões sequenciais ou de série temporal

4. Conhecimento implícito, emergente e não estruturado

5. Agrupamentos e segmentações


Assinale a alternativa que indica todas as afirmativas corretas.

Alternativas
Q1962675 Banco de Dados

Uma regra de associação utilizada em mineração de dados é uma expressão de implicação no formato X → Y, onde X e Y são conjuntos disjuntos de itens, onde X ∩ Y = Ø. A força de uma regra de associação pode ser medida em termos do seu suporte (sup) e confiança (conf).


Assinale a opção que apresenta a definição formal da métrica confiança.

Alternativas
Q1962668 Banco de Dados

Leia o fragmento a seguir.


“Atualmente, no contexto do Big Data e Data Analytics, faz-se referência às características enunciadas por pesquisadores e produtores de soluções como sendo um conjunto de cinco Vs. Originalmente, a definição clássica de Big Data fez referência a três Vs fundamentais: _____, _____ e _____ de dados que demandam formas inovadoras e rentáveis de processamento da informação, para melhor percepção e tomada de decisão.”


Assinale a opção cujos itens completam corretamente as lacunas do fragmento acima, na ordem apresentada.

Alternativas
Q1962636 Banco de Dados

A mineração de dados (Data Mining) envolve um conjunto de algoritmos e ferramentas que são utilizados para a exploração de dados.


Assinale o algoritmo/método usado na extração de regras de associação.

Alternativas
Q1961937 Banco de Dados

Leia o fragmento a seguir.


“CRISP-DM é um modelo de referência não proprietário, neutro, documentado e disponível na Internet, sendo amplamente utilizado para descrever o ciclo de vida de projetos de Ciência de Dados. O modelo é composto por seis fases: 1. entendimento do negócio; 2. _____; 3. _____; 4. Modelagem; 5. _____ ; e 6. implantação”.


Assinale a opção cujos itens completam corretamente as lacunas do fragmento acima, na ordem apresentada.

Alternativas
Q1961654 Banco de Dados
No que diz respeito aos dados estruturados e não estruturados, aos bancos de dados relacionais, ao modelo de referência CRISP-DM e à modelagem preditiva, julgue o item seguinte.  

No início de um processo de descoberta de conhecimento em bases de dados (KDD), o CRISP-DM recomenda, em relação ao levantamento do hardware existente, que o processo de KDD seja realizado em plataforma com arquitetura não expansível, que forneça suporte e acesso somente à base de dados homogênea. 
Alternativas
Q1960010 Banco de Dados
Julgue o item, referente à modelagem dimensional, ao modelo de referência CRISP-DM e à mineração de dados. 
O uso da mineração de dados permite, por exemplo, que as empresas mais bem planejem a logística de distribuição dos seus produtos, prevendo picos nas vendas. 
Alternativas
Q1960009 Banco de Dados
Julgue o item, referente à modelagem dimensional, ao modelo de referência CRISP-DM e à mineração de dados. 
O modelo de referência CRISP-DM, composto por quatro fases não cíclicas, permite o fluxo unidirecional, ou seja, pode ir e voltar entre as fases. 
Alternativas
Q1953244 Banco de Dados

Atualmente, conforme a tecnologia evolui, novos termos vão surgindo, particularmente com o aumento da importância dos dados na criação de estratégias de crescimento e tomadas de decisão. Nesse contexto, dois termos se destacam, descritos a seguir:


I. É um repositório central de informações que podem ser analisadas para tomar decisões mais adequadas. Os dados fluem de sistemas transacionais, bancos de dados relacionais e de outras fontes. Analistas de negócios, engenheiros de dados, cientistas de dados e tomadores de decisões acessam os dados por meio de ferramentas de inteligência de negócios (BI), clientes SQL e outros aplicativos de análise.

II. É um processo analítico no qual grande quantidade de dados são explorados com o objetivo de encontrar padrões relevantes ou relação sistemática entre variáveis, os quais são validados. Todo esse processo acontece em três etapas: exploração, construção de modelo (padrão) e validação. As ferramentas empregadas analisam dados em busca de oportunidades ou problemas e fazem o diagnóstico do comportamento dos negócios. Sendo assim, cabe ao usuário utilizar o conhecimento para produzir vantagens competitivas.


Os termos descritos em I e II representam os conceitos, respectivamente, de:

Alternativas
Q1952950 Banco de Dados
Assinale a opção que corresponde a métodos estatísticos que assumem distribuição ou modelo de probabilidade de dados, ou medidas de distância por meio das quais os objetos procurados são substancialmente distantes dos demais utilizados em data mining
Alternativas
Q1943916 Banco de Dados

Quanto à mineração de dados e ao CRISP-DM (Cross-Industry Standard Process for Data Mining), julgue o item.


No modelo CRISP-DM, a modelagem é uma das fases mais importantes do processo, consistindo no conhecimento do domínio do negócio, ou seja, no conhecimento e na compreensão dos objetivos do projeto de mineração a partir da perspectiva do negócio. 

Alternativas
Q1943915 Banco de Dados

Quanto à mineração de dados e ao CRISP-DM (Cross-Industry Standard Process for Data Mining), julgue o item.


O modelo CRISP-DM é bastante utilizado graças à sua rigidez quanto à execução de cada uma de suas fases; ele não permite que um projeto retorne a uma etapa ou fase anterior, pois a sequência de fases é rigorosa e deve ser seguida. 

Alternativas
Respostas
121: D
122: D
123: D
124: D
125: E
126: D
127: D
128: D
129: C
130: D
131: D
132: A
133: D
134: E
135: C
136: E
137: D
138: C
139: E
140: E