Questões de Concurso
Para cespe / cebraspe
Foram encontradas 316.228 questões
Resolva questões gratuitamente!
Junte-se a mais de 4 milhões de concurseiros!
A respeito de Big Data, julgue o próximo item.
No modelo SaaS (software as a service) da computação em
nuvem utilizado para Big Data, a aplicação e os dados são
gerenciados pelo provedor da nuvem.
A respeito de Big Data, julgue o próximo item.
O YARN (Yet Another Resource Negotiator) é um sistema
de arquivos distribuídos que faz parte do framework Hadoop.
A respeito de Big Data, julgue o próximo item.
A coleta de dados por meio de aplicativos é considerada
explícita, porque o usuário a autoriza.
A respeito de Big Data, julgue o próximo item.
Em Big Data, ruídos consistem em informações extras que
acabam deturpando as análises, enquanto overfitting designa
a interpretação equivocada dos ruídos como dados legítimos.
A respeito de Big Data, julgue o próximo item.
Pipelines de dados apresentam uma única estrutura para o
recebimento dos dados originados de uma fonte não
confiável.
Julgue o próximo item, referente ao processamento de linguagem natural.
Na redução de palavras ao radical, ocorre under-stemming
quando duas palavras separadas são reduzidas erroneamente
à mesma raiz e, com isso, ocorre a perda de distinção
semântica entre palavras com significados diferentes.
Julgue o próximo item, referente ao processamento de linguagem natural.
A lematização prescinde do POS tagging para que as
palavras sejam reduzidas corretamente, pois todas as
palavras são reduzidas ao mesmo lemma, independentemente
de sua classe gramatical.
Julgue o próximo item, referente ao processamento de linguagem natural.
A similaridade de cosseno é uma métrica pela qual se avalia
a similaridade entre dois vetores com base no ângulo entre
eles em um espaço vetorial, de forma que, à medida que os
vetores se aproximarem, aumentará a similaridade de
cosseno.
A respeito de técnicas de redução de dimensionalidade, julgue o item subsecutivo.
Para utilizar de forma adequada a análise de componentes
principais (PCA, na sigla em inglês), é essencial normalizar
os dados; se as variáveis não estiverem na mesma escala,
aquelas com maior variância terão maior impacto,
distorcendo o resultado da PCA.
A respeito de técnicas de redução de dimensionalidade, julgue o item subsecutivo.
Quando da configuração dos parâmetros do autoencoder, o
tamanho do espaço latente é uma informação crucial, pois
determina o tamanho do espaço onde os dados de entrada
serão comprimidos.
Acerca da avaliação de modelos de classificação, julgue o item que se segue.
A área sob a curva ROC (receiver operating characteristic) é
uma métrica de qualidade útil para avaliar um modelo:
quanto mais próxima a curva estiver do canto superior
direito do gráfico, melhor será a predição do modelo.
Acerca da avaliação de modelos de classificação, julgue o item que se segue.
Um modelo de classificação que apresenta alta revocação é
útil em contextos em que seja crucial identificar a maior
quantidade possível de casos positivos, mesmo que isso
resulte em um número maior de falsos positivos.
Acerca da avaliação de modelos de classificação, julgue o item que se segue.
A matriz de confusão, em problemas de classificação
multiclasses, é uma tabela com duas linhas e duas colunas;
na diagonal principal dessa matriz quadrada, estão os valores
corretos e, na matriz secundária, os erros cometidos pelo
modelo.
Acerca da avaliação de modelos de classificação, julgue o item que se segue.
A acurácia é uma métrica adequada para a avaliação de
modelos quando não há desbalanceamento de classes, pois
reflete com precisão a capacidade geral do modelo de fazer
previsões corretas em todas as classes.
A respeito de KNN (k-nearest neighbours), SVM (support vector machines), deep learning e técnicas de agrupamento, julgue o item a seguir.
O SVM classifica os dados encontrando uma linha ou
hiperplano ideal; essa linha de separação é encontrada entre
duas classes distintas pela análise dos dois pontos, um de
cada grupo, mais próximos da outra classe.
A respeito de KNN (k-nearest neighbours), SVM (support vector machines), deep learning e técnicas de agrupamento, julgue o item a seguir.
Uma das formas de se realizar um agrupamento é por meio
de técnicas de agrupamento baseadas em hierarquia, em que
se pode criar estrutura hierárquica de acordo com a
proximidade entre os indivíduos, o que resulta em uma
árvore binária.
A respeito de KNN (k-nearest neighbours), SVM (support vector machines), deep learning e técnicas de agrupamento, julgue o item a seguir.
SVM é um algoritmo de aprendizado de máquina
supervisionado que pode ser usado para desafios de
classificação ou regressão.
A respeito de KNN (k-nearest neighbours), SVM (support vector machines), deep learning e técnicas de agrupamento, julgue o item a seguir.
KNN é um algoritmo de aprendizado supervisionado não
paramétrico que não pode ser utilizado em problemas de
classificação, uma vez que seu objetivo é prever valores
numéricos e não valores categóricos.
A respeito de KNN (k-nearest neighbours), SVM (support vector machines), deep learning e técnicas de agrupamento, julgue o item a seguir.
Deep learning é um tipo de aprendizado de máquina que usa
redes neurais artificiais para permitir que sistemas digitais
aprendam e tomem decisões com base em dados não
estruturados e não rotulados.
Julgue o próximo item, relativo a Naive Bayes e random forest.
Nas árvores de decisão e em random forest, são utilizadas
técnicas estatísticas com o objetivo de se produzir, a partir de
um conjunto de observações, uma predição de valores em
função de uma ou mais variáveis independentes contínuas
e(ou) binárias.