Questões de Concurso Público PROCERGS 2023 para ANC - Analista em Computação - Ênfase em Ciências de Dados

Foram encontradas 60 questões

Q2172380 Engenharia de Software
Para evitar overfitting, uma prática comum é randomicamente dividir a base de dados em N conjuntos de dados de tamanhos aproximadamente iguais. O modelo é treinado com N-1 conjuntos e testado com o restante. Uma medida de erro é obtida. Esse processo é repetido um total de N vezes através das várias combinações dos N conjuntos de dados. Por fim, calcula-se a média de validação dos N experimentos para se obter a estimativa de erro. Qual é o nome dessa técnica descrita e utilizada para avaliar modelos de aprendizado de máquina?
Alternativas
Q2172381 Engenharia de Software
Analise as assertivas abaixo sobre Naïve Bayes:
I. É um classificador ingênuo que assume que a presença ou ausência de uma característica particular de uma classe não está relacionada com a presença ou ausência de outras características.
II. As variáveis de entrada são geralmente categóricas, mas variações do algoritmo podem aceitar variáveis contínuas. Também existem maneiras de converter variáveis contínuas em categóricas. Esse processo é denominado discretização de variáveis contínuas.
III. A filtragem de spam é um exemplo clássico do uso de Naïve Bayes para distinguir e-mail de spam de e-mail legítimo. Muitos clientes de e-mail modernos implementam variantes de filtragem bayesiana de spam.
Quais estão corretas?
Alternativas
Q2172382 Engenharia de Software
__________ consiste em uma análise estatística que envolve duas variáveis: a de resposta e a preditiva, e considera que o valor da variável de resposta (ou dependente) pode ser estimado por uma combinação de variáveis explicativas (dependentes). Já quando a variável de resultado é de natureza categórica, __________ pode ser usada para prever a probabilidade de um resultado com base nas variáveis de entrada que podem ser explicativas, contínuas e/ou binárias.
Assinale a alternativa que preenche, correta e respectivamente, as lacunas do trecho acima.
Alternativas
Q2172383 Banco de Dados
__________ é uma classe de métodos ensemble que utiliza classificadores de árvore de decisão. É uma combinação de preditores de árvores tal que cada árvore depende dos valores de um vetor aleatório amostrado independentemente e com a mesma distribuição para todas as árvores.
Assinale a alternativa que preenche corretamente a lacuna do trecho acima.
Alternativas
Q2172384 Banco de Dados
__________ é um método de classificação binária que traça um hiperplano ótimo que maximiza a margem de separação entre duas classes de dados. A etapa principal do algoritmo é descobrir os vetores que são as instâncias equidistantes do hiperplano.
Assinale a alternativa que preenche corretamente a lacuna do trecho acima.
Alternativas
Respostas
51: B
52: E
53: C
54: B
55: B