Questões de Concurso
Foram encontradas 144.615 questões
Resolva questões gratuitamente!
Junte-se a mais de 4 milhões de concurseiros!
A respeito de Big Data, julgue o próximo item.
Subconjunto de um data warehouse, o data mart é
especializado em uma área específica de uma organização.
A respeito de Big Data, julgue o próximo item.
Em um data lake, os dados são depositados em estado bruto,
sem terem passado por qualquer análise e mesmo sem terem
uma governança.
A respeito de Big Data, julgue o próximo item.
No modelo SaaS (software as a service) da computação em
nuvem utilizado para Big Data, a aplicação e os dados são
gerenciados pelo provedor da nuvem.
A respeito de Big Data, julgue o próximo item.
O YARN (Yet Another Resource Negotiator) é um sistema
de arquivos distribuídos que faz parte do framework Hadoop.
A respeito de Big Data, julgue o próximo item.
A coleta de dados por meio de aplicativos é considerada
explícita, porque o usuário a autoriza.
A respeito de Big Data, julgue o próximo item.
Em Big Data, ruídos consistem em informações extras que
acabam deturpando as análises, enquanto overfitting designa
a interpretação equivocada dos ruídos como dados legítimos.
A respeito de Big Data, julgue o próximo item.
Pipelines de dados apresentam uma única estrutura para o
recebimento dos dados originados de uma fonte não
confiável.
Julgue o próximo item, referente ao processamento de linguagem natural.
Na redução de palavras ao radical, ocorre under-stemming
quando duas palavras separadas são reduzidas erroneamente
à mesma raiz e, com isso, ocorre a perda de distinção
semântica entre palavras com significados diferentes.
Julgue o próximo item, referente ao processamento de linguagem natural.
A lematização prescinde do POS tagging para que as
palavras sejam reduzidas corretamente, pois todas as
palavras são reduzidas ao mesmo lemma, independentemente
de sua classe gramatical.
Julgue o próximo item, referente ao processamento de linguagem natural.
A similaridade de cosseno é uma métrica pela qual se avalia
a similaridade entre dois vetores com base no ângulo entre
eles em um espaço vetorial, de forma que, à medida que os
vetores se aproximarem, aumentará a similaridade de
cosseno.
A respeito de técnicas de redução de dimensionalidade, julgue o item subsecutivo.
Para utilizar de forma adequada a análise de componentes
principais (PCA, na sigla em inglês), é essencial normalizar
os dados; se as variáveis não estiverem na mesma escala,
aquelas com maior variância terão maior impacto,
distorcendo o resultado da PCA.
A respeito de técnicas de redução de dimensionalidade, julgue o item subsecutivo.
Quando da configuração dos parâmetros do autoencoder, o
tamanho do espaço latente é uma informação crucial, pois
determina o tamanho do espaço onde os dados de entrada
serão comprimidos.
A respeito de KNN (k-nearest neighbours), SVM (support vector machines), deep learning e técnicas de agrupamento, julgue o item a seguir.
O SVM classifica os dados encontrando uma linha ou
hiperplano ideal; essa linha de separação é encontrada entre
duas classes distintas pela análise dos dois pontos, um de
cada grupo, mais próximos da outra classe.
A respeito de KNN (k-nearest neighbours), SVM (support vector machines), deep learning e técnicas de agrupamento, julgue o item a seguir.
Uma das formas de se realizar um agrupamento é por meio
de técnicas de agrupamento baseadas em hierarquia, em que
se pode criar estrutura hierárquica de acordo com a
proximidade entre os indivíduos, o que resulta em uma
árvore binária.
A respeito de KNN (k-nearest neighbours), SVM (support vector machines), deep learning e técnicas de agrupamento, julgue o item a seguir.
SVM é um algoritmo de aprendizado de máquina
supervisionado que pode ser usado para desafios de
classificação ou regressão.
A respeito de KNN (k-nearest neighbours), SVM (support vector machines), deep learning e técnicas de agrupamento, julgue o item a seguir.
KNN é um algoritmo de aprendizado supervisionado não
paramétrico que não pode ser utilizado em problemas de
classificação, uma vez que seu objetivo é prever valores
numéricos e não valores categóricos.
A respeito de KNN (k-nearest neighbours), SVM (support vector machines), deep learning e técnicas de agrupamento, julgue o item a seguir.
Deep learning é um tipo de aprendizado de máquina que usa
redes neurais artificiais para permitir que sistemas digitais
aprendam e tomem decisões com base em dados não
estruturados e não rotulados.
A respeito de visualização, análise exploratória de dados e geoprocessamento, julgue o seguinte item.
No contexto de um layout de relatório, o equilíbrio
assimétrico consiste na distribuição do peso uniforme dos
objetos em ambas as metades da página, independentemente
do tamanho dos objetos.
A respeito de visualização, análise exploratória de dados e geoprocessamento, julgue o seguinte item.
A aplicação de hierarquias de atributo em modelos analíticos
é uma prática eficiente, que permite a organização de valores
pré-agregados em cada nível e otimiza a análise de dados.
A respeito de visualização, análise exploratória de dados e geoprocessamento, julgue o seguinte item.
Os mapas temáticos incluem áreas geográficas delineadas
por um ou mais polígonos, a exemplo dos mapas de uso do
solo e mapas que indicam a capacidade agrícola de
determinada região.