Questões de Concurso
Comentadas sobre data mining em banco de dados
Foram encontradas 416 questões
Julgue o item a seguir, a respeito de inteligência artificial (IA) e machine learning.
K-means é um algoritmo de aprendizado não supervisionado,
em que se calcula a distância entre os objetos da base e cada
um dos centroides; em que se atribui cada objeto ao
centroide mais próximo; e em que se classifica cada item
para sua média mais próxima.
A medida de confiança de uma regra de associação é calculada pela frequência com que tal regra aparece em transações individuais na base de dados transacional.
I. Data Mining faz a varredura de uma pequena quantidade de dados de cada vez. II. Business Intelligence atua na parte física de infraestrutura. III. Data Mining também é conhecido como mineração de dados. IV. Business Intelligence passou a ser tratado como uma aplicação de estratégia integrada.
1. Seleção de dados 2. Limpeza de dados 3.Mineração de dados 4. Avaliação
( ) São aplicados algoritmos para extração de características dos dados.
( ) O subconjunto objetivado dos dados e os atributos de interesse são identificados examinando-se o conjunto de dados bruto inteiro.
( ) Os padrões são apresentados para os usuários em uma forma inteligível.
( ) Ruído e exceções são removidos, valores de campo são transformados em unidades comuns e alguns campos são criados pela combinação de campos já existentes para facilitar a análise. Normalmente, os dados são colocados em um formato relacional, e várias tabelas podem ser combinadas em uma etapa de desnormalização.
Assinale a alternativa que apresenta a numeração CORRETA da coluna da direita, de cima para baixo, conforme Raghu e Gehrke (2011, p. 739):
Sendo assim, na primeira abordagem, Carla utilizou como base o algoritmo de machine learning:
Assinale a alternativa que preenche corretamente a lacuna do trecho acima.
Assinale a alternativa que preenche corretamente a lacuna do trecho acima.
I. Dada uma coleção de objetos, cada um com n atributos, k-means é um método que, para I - um valor escolhido de k, identifica k grupos de objetos com base na proximidade dos objetos com relação ao centroide do grupo. O centro é determinado como a média do vetor n-dimensional de atributos de cada grupo.
II. Por ser um método supervisionado, o K-means ajuda a excluir a subjetividade das análises.
III. K-means é um método para definir agrupamentos. Uma vez que os agrupamentos e os seus centroides são identificados, é fácil classificar novos objetivos para um cluster baseado na distância do objeto do centroide mais próximo.
Quais estão corretas?
Coluna 1 1. Aprendizado Supervisionado. 2. Aprendizado Não Supervisionado. 3. Aprendizado Profundo.
Coluna 2 ( ) O algoritmo recebe um conjunto de dados rotulados e aprende comparando a saída do modelo com a saída esperada, reajustando seus parâmetros até chegar em um limiar aceitável e pré-determinado a priori.
( ) Os algoritmos buscam encontrar padrões ou estruturas em conjuntos de dados não rotulados, por exemplo, gerando agrupamentos de dados.
( ) Conjunto de algoritmos que modelam abstrações de alto nível de dados usando grafos com várias camadas de processamento, compostas de várias transformações lineares e não lineares.
( ) Processo de aprendizado baseado em redes neurais com várias camadas (em geral, mais de cinco camadas): entrada, saída e oculta.
A ordem correta de preenchimento dos parênteses, de cima para baixo, é:
A respeito de data warehouse e data mining, julgue o próximo item.
Fatos, dimensões e medidas são elementos essenciais de um
data warehouse.
A respeito de data warehouse e data mining, julgue o próximo item.
O data mining é um processo usado para extrair e analisar
informações que revelam padrões ou tendências estratégicas
do negócio.
Com relação a soluções de suporte à decisão, julgue o item subsecutivo.
Data mining utiliza diversos tipos de padrões e técnicas para
descobrir o conhecimento em base de dados. Eles são
provenientes, automaticamente, do banco de dados e não há
interação manual na descoberta de novos tipos de padrões.
Para essa tarefa, o funcionário de TI deve utilizar o aprendizado de máquina
No que diz respeito ao modelo de referência CRISP-DM (Cross Industry Standard Process for Data Mining), julgue o item.
No ciclo do CRISP-DM, a fase de implantação é a mais simples (jamais será um processo complexo), pois se resume à execução de scripts.
No que diz respeito ao modelo de referência CRISP-DM (Cross Industry Standard Process for Data Mining), julgue o item.
O entendimento do negócio é a fase do ciclo do CRISP-DM que exige mais tempo em mineração de dados, pois estima-se que essa etapa, geralmente, leve entre 50 e 70% do tempo e do esforço de um projeto.
No que diz respeito ao modelo de referência CRISP-DM (Cross Industry Standard Process for Data Mining), julgue o item.
Modelagem e avaliação são algumas das fases do ciclo do CRISP-DM.