Questões de Concurso Para ciência da informação

Foram encontradas 170 questões

Resolva questões gratuitamente!

Junte-se a mais de 4 milhões de concurseiros!

Q1895665 Banco de Dados

Com respeito a análise de componentes principais, mistura de gaussianas e agrupamento k-means, julgue o item que se segue. 



Considere que, em uma análise de agrupamentos por meio de mistura de gaussianas, três distribuições normais com médias Imagem associada para resolução da questão  se referem, respectivamente, aos clusters 1, 2 e 3. Nessa situação, pelo modelo de mistura de gaussianas, o cluster 1 é constituído pelas observações mais próximas da média Imagem associada para resolução da questão

Alternativas
Q1895664 Engenharia de Software

Com respeito a análise de componentes principais, mistura de gaussianas e agrupamento k-means, julgue o item que se segue. 



Se a matriz de variância-covariância referente a três variáveis for

Imagem associada para resolução da questão

e se o menor autovalor dessa matriz for igual a 1,84, então as duas primeiras componentes principais explicam 81,6% da variação total referente a essas variáveis.  

Alternativas
Q1895663 Banco de Dados

Os hiperparâmetros de um modelo são todos os parâmetros que podem ser definidos antes do inicio do treinamento, diferentemente dos parâmetros do modelo, que são aprendidos durante o treino do modelo. A busca por hiperparâmetros de determinado algoritmo de aprendizado de máquina que retorne o melhor desempenho medido em um conjunto de validação deu origem ao conceito de otimização de hiperparâmetros.

Acerca dos conceitos de otimização de hiperparâmetros de modelos de aprendizado de máquinas, julgue o item que se segue.  




A otimização bayesiana se utiliza do conceito de probabilidade para encontrar o valor de entrada de uma função que possa retornar o menor valor de saída possível. Nesse método, o número de iterações de pesquisa pode ser reduzido a partir da escolha dos valores de entrada, levando em consideração os resultados anteriores, o que caracteriza um processo iterativo. 

Alternativas
Q1895661 Programação

Os algoritmos de aprendizado supervisionado partem de um conjunto de dados rotulados para fazer previsões sobre novos dados não rotulados. O Python scikit-learn é uma biblioteca de código aberto utilizada para codificações de rotinas em aprendizado de máquina supervisionado; ela oferece ainda uma série de ferramentas utilizadas no ajuste de modelos e no pré-processamento de dados, para a seleção e avaliação de modelos.

Tendo como referência essas informações, julgue o item a seguir.


No código a seguir, Imagem associada para resolução da questão DecisionTreeClassifier é um classificador que recebe como entrada dois arrays: um array X,Imagem associada para resolução da questão de valores inteiros, contendo os rótulos de classe para as amostras de treinamento; e um array Y,Imagem associada para resolução da questãoesparso ou denso, contendo as amostras de treinamento.


>>> from sklearn import tree

>>> X = [[0, 0], [1, 1]]

>>> Y = [0, 1]

>>> clf = tree.DecisionTreeClassifier()

>>> clf = clf.fit(X, Y)

Alternativas
Q1895660 Banco de Dados
Os modelos ditos fracos, também chamados modelos de base, muitas vezes são combinados com o objetivo de se construir um modelo mais forte, no qual a variância e o viés atinjam equilíbrio satisfatório. Esse procedimento, denominado ensembles, é muito utilizado em ciência de dados e aprendizado de máquinas. Quanto às formas de ensembles, julgue o próximo item. 


O ensemble denominado bagging tem como foco principal a redução do viés e não da variância, treinando-se os modelos em sequência, tal que os erros dos primeiros modelos treinados são utilizados para o ajuste nos pesos matemáticos dos próximos modelos. 
Alternativas
Respostas
46: E
47: C
48: C
49: E
50: E