Questões de Concurso
Para especialista em regulação
Foram encontradas 3.112 questões
Resolva questões gratuitamente!
Junte-se a mais de 4 milhões de concurseiros!
Julgue o próximo item, referente ao processamento de linguagem natural.
Na redução de palavras ao radical, ocorre under-stemming
quando duas palavras separadas são reduzidas erroneamente
à mesma raiz e, com isso, ocorre a perda de distinção
semântica entre palavras com significados diferentes.
Julgue o próximo item, referente ao processamento de linguagem natural.
A lematização prescinde do POS tagging para que as
palavras sejam reduzidas corretamente, pois todas as
palavras são reduzidas ao mesmo lemma, independentemente
de sua classe gramatical.
Julgue o próximo item, referente ao processamento de linguagem natural.
A similaridade de cosseno é uma métrica pela qual se avalia
a similaridade entre dois vetores com base no ângulo entre
eles em um espaço vetorial, de forma que, à medida que os
vetores se aproximarem, aumentará a similaridade de
cosseno.
A respeito de técnicas de redução de dimensionalidade, julgue o item subsecutivo.
Para utilizar de forma adequada a análise de componentes
principais (PCA, na sigla em inglês), é essencial normalizar
os dados; se as variáveis não estiverem na mesma escala,
aquelas com maior variância terão maior impacto,
distorcendo o resultado da PCA.
A respeito de técnicas de redução de dimensionalidade, julgue o item subsecutivo.
Quando da configuração dos parâmetros do autoencoder, o
tamanho do espaço latente é uma informação crucial, pois
determina o tamanho do espaço onde os dados de entrada
serão comprimidos.
Acerca da avaliação de modelos de classificação, julgue o item que se segue.
A área sob a curva ROC (receiver operating characteristic) é
uma métrica de qualidade útil para avaliar um modelo:
quanto mais próxima a curva estiver do canto superior
direito do gráfico, melhor será a predição do modelo.
Acerca da avaliação de modelos de classificação, julgue o item que se segue.
Um modelo de classificação que apresenta alta revocação é
útil em contextos em que seja crucial identificar a maior
quantidade possível de casos positivos, mesmo que isso
resulte em um número maior de falsos positivos.
Acerca da avaliação de modelos de classificação, julgue o item que se segue.
A matriz de confusão, em problemas de classificação
multiclasses, é uma tabela com duas linhas e duas colunas;
na diagonal principal dessa matriz quadrada, estão os valores
corretos e, na matriz secundária, os erros cometidos pelo
modelo.
Acerca da avaliação de modelos de classificação, julgue o item que se segue.
A acurácia é uma métrica adequada para a avaliação de
modelos quando não há desbalanceamento de classes, pois
reflete com precisão a capacidade geral do modelo de fazer
previsões corretas em todas as classes.
A respeito de KNN (k-nearest neighbours), SVM (support vector machines), deep learning e técnicas de agrupamento, julgue o item a seguir.
O SVM classifica os dados encontrando uma linha ou
hiperplano ideal; essa linha de separação é encontrada entre
duas classes distintas pela análise dos dois pontos, um de
cada grupo, mais próximos da outra classe.
A respeito de KNN (k-nearest neighbours), SVM (support vector machines), deep learning e técnicas de agrupamento, julgue o item a seguir.
Uma das formas de se realizar um agrupamento é por meio
de técnicas de agrupamento baseadas em hierarquia, em que
se pode criar estrutura hierárquica de acordo com a
proximidade entre os indivíduos, o que resulta em uma
árvore binária.
A respeito de KNN (k-nearest neighbours), SVM (support vector machines), deep learning e técnicas de agrupamento, julgue o item a seguir.
SVM é um algoritmo de aprendizado de máquina
supervisionado que pode ser usado para desafios de
classificação ou regressão.
A respeito de KNN (k-nearest neighbours), SVM (support vector machines), deep learning e técnicas de agrupamento, julgue o item a seguir.
KNN é um algoritmo de aprendizado supervisionado não
paramétrico que não pode ser utilizado em problemas de
classificação, uma vez que seu objetivo é prever valores
numéricos e não valores categóricos.
A respeito de KNN (k-nearest neighbours), SVM (support vector machines), deep learning e técnicas de agrupamento, julgue o item a seguir.
Deep learning é um tipo de aprendizado de máquina que usa
redes neurais artificiais para permitir que sistemas digitais
aprendam e tomem decisões com base em dados não
estruturados e não rotulados.
Julgue o próximo item, relativo a Naive Bayes e random forest.
Nas árvores de decisão e em random forest, são utilizadas
técnicas estatísticas com o objetivo de se produzir, a partir de
um conjunto de observações, uma predição de valores em
função de uma ou mais variáveis independentes contínuas
e(ou) binárias.
Julgue o próximo item, relativo a Naive Bayes e random forest.
O algoritmo de classificação Naive Bayes pode ser utilizado
para o cálculo da probabilidade de ocorrência de um evento,
com base em probabilidades obtidas em eventos numéricos
passados, e, por isso, não pode ser empregado em atividades
de classificação textual.
Julgue o próximo item, relativo a Naive Bayes e random forest.
Random forest é um algoritmo de classificação que permite a
realização de mineração dos dados por meio da criação de
estruturas de aprendizagem a partir de uma base de dados na
qual se utiliza uma única árvore de decisão para a
classificação dos dados.
Julgue o próximo item, relativo a Naive Bayes e random forest.
Naive Bayes é um algoritmo de classificação baseado na
aprendizagem por reforço, em que um agente realiza uma
ação e recebe uma recompensa de acordo com o resultado
dessa ação por meio da implementação do teorema de Bayes,
com o objetivo de encontrar a probabilidade a posteriori.
Julgue o próximo item, relativo a Naive Bayes e random forest.
Tamanho do nó, número de árvores e número de recursos
amostrados, ou número de preditores amostrados, são
parâmetros de algoritmos random forest.
No que se refere à governança de dados, julgue o próximo item.
Um dado de referência, como, por exemplo, os dados dos
clientes, é uma informação crucial para a operação do
negócio.