Questões de Concurso Para cespe / cebraspe

Foram encontradas 316.228 questões

Resolva questões gratuitamente!

Junte-se a mais de 4 milhões de concurseiros!

Q3022088 Banco de Dados

A respeito de Big Data, julgue o próximo item.


No modelo SaaS (software as a service) da computação em nuvem utilizado para Big Data, a aplicação e os dados são gerenciados pelo provedor da nuvem.  

Alternativas
Q3022087 Banco de Dados

A respeito de Big Data, julgue o próximo item.


O YARN (Yet Another Resource Negotiator) é um sistema de arquivos distribuídos que faz parte do framework Hadoop.

Alternativas
Q3022086 Banco de Dados

A respeito de Big Data, julgue o próximo item.


A coleta de dados por meio de aplicativos é considerada explícita, porque o usuário a autoriza.

Alternativas
Q3022085 Banco de Dados

A respeito de Big Data, julgue o próximo item.


Em Big Data, ruídos consistem em informações extras que acabam deturpando as análises, enquanto overfitting designa a interpretação equivocada dos ruídos como dados legítimos.

Alternativas
Q3022084 Banco de Dados

A respeito de Big Data, julgue o próximo item.


Pipelines de dados apresentam uma única estrutura para o recebimento dos dados originados de uma fonte não confiável. 

Alternativas
Q3022083 Engenharia de Software

Julgue o próximo item, referente ao processamento de linguagem natural.


Na redução de palavras ao radical, ocorre under-stemming quando duas palavras separadas são reduzidas erroneamente à mesma raiz e, com isso, ocorre a perda de distinção semântica entre palavras com significados diferentes.

Alternativas
Q3022082 Engenharia de Software

Julgue o próximo item, referente ao processamento de linguagem natural.


A lematização prescinde do POS tagging para que as palavras sejam reduzidas corretamente, pois todas as palavras são reduzidas ao mesmo lemma, independentemente de sua classe gramatical. 

Alternativas
Q3022081 Engenharia de Software

Julgue o próximo item, referente ao processamento de linguagem natural.


A similaridade de cosseno é uma métrica pela qual se avalia a similaridade entre dois vetores com base no ângulo entre eles em um espaço vetorial, de forma que, à medida que os vetores se aproximarem, aumentará a similaridade de cosseno. 

Alternativas
Q3022079 Banco de Dados

A respeito de técnicas de redução de dimensionalidade, julgue o item subsecutivo.


Para utilizar de forma adequada a análise de componentes principais (PCA, na sigla em inglês), é essencial normalizar os dados; se as variáveis não estiverem na mesma escala, aquelas com maior variância terão maior impacto, distorcendo o resultado da PCA.

Alternativas
Q3022078 Banco de Dados

A respeito de técnicas de redução de dimensionalidade, julgue o item subsecutivo.


Quando da configuração dos parâmetros do autoencoder, o tamanho do espaço latente é uma informação crucial, pois determina o tamanho do espaço onde os dados de entrada serão comprimidos.

Alternativas
Q3022077 Estatística

Acerca da avaliação de modelos de classificação, julgue o item que se segue.


A área sob a curva ROC (receiver operating characteristic) é uma métrica de qualidade útil para avaliar um modelo: quanto mais próxima a curva estiver do canto superior direito do gráfico, melhor será a predição do modelo. 

Alternativas
Q3022076 Estatística

Acerca da avaliação de modelos de classificação, julgue o item que se segue.


Um modelo de classificação que apresenta alta revocação é útil em contextos em que seja crucial identificar a maior quantidade possível de casos positivos, mesmo que isso resulte em um número maior de falsos positivos.

Alternativas
Q3022075 Estatística

Acerca da avaliação de modelos de classificação, julgue o item que se segue.


A matriz de confusão, em problemas de classificação multiclasses, é uma tabela com duas linhas e duas colunas; na diagonal principal dessa matriz quadrada, estão os valores corretos e, na matriz secundária, os erros cometidos pelo modelo.

Alternativas
Q3022074 Estatística

Acerca da avaliação de modelos de classificação, julgue o item que se segue.


A acurácia é uma métrica adequada para a avaliação de modelos quando não há desbalanceamento de classes, pois reflete com precisão a capacidade geral do modelo de fazer previsões corretas em todas as classes.

Alternativas
Q3022073 Engenharia de Software

A respeito de KNN (k-nearest neighbours), SVM (support vector machines), deep learning e técnicas de agrupamento, julgue o item a seguir.


O SVM classifica os dados encontrando uma linha ou hiperplano ideal; essa linha de separação é encontrada entre duas classes distintas pela análise dos dois pontos, um de cada grupo, mais próximos da outra classe.

Alternativas
Q3022072 Engenharia de Software

A respeito de KNN (k-nearest neighbours), SVM (support vector machines), deep learning e técnicas de agrupamento, julgue o item a seguir.


Uma das formas de se realizar um agrupamento é por meio de técnicas de agrupamento baseadas em hierarquia, em que se pode criar estrutura hierárquica de acordo com a proximidade entre os indivíduos, o que resulta em uma árvore binária.

Alternativas
Q3022071 Engenharia de Software

A respeito de KNN (k-nearest neighbours), SVM (support vector machines), deep learning e técnicas de agrupamento, julgue o item a seguir.


SVM é um algoritmo de aprendizado de máquina supervisionado que pode ser usado para desafios de classificação ou regressão.

Alternativas
Q3022070 Engenharia de Software

A respeito de KNN (k-nearest neighbours), SVM (support vector machines), deep learning e técnicas de agrupamento, julgue o item a seguir.


KNN é um algoritmo de aprendizado supervisionado não paramétrico que não pode ser utilizado em problemas de classificação, uma vez que seu objetivo é prever valores numéricos e não valores categóricos.

Alternativas
Q3022069 Engenharia de Software

A respeito de KNN (k-nearest neighbours), SVM (support vector machines), deep learning e técnicas de agrupamento, julgue o item a seguir.


Deep learning é um tipo de aprendizado de máquina que usa redes neurais artificiais para permitir que sistemas digitais aprendam e tomem decisões com base em dados não estruturados e não rotulados. 

Alternativas
Q3022068 Estatística

Julgue o próximo item, relativo a Naive Bayes e random forest


Nas árvores de decisão e em random forest, são utilizadas técnicas estatísticas com o objetivo de se produzir, a partir de um conjunto de observações, uma predição de valores em função de uma ou mais variáveis independentes contínuas e(ou) binárias.

Alternativas
Respostas
1981: C
1982: E
1983: E
1984: C
1985: E
1986: E
1987: E
1988: C
1989: C
1990: C
1991: E
1992: C
1993: E
1994: C
1995: C
1996: C
1997: C
1998: E
1999: C
2000: E