Questões de Concurso
Para cespe / cebraspe
Foram encontradas 316.228 questões
Resolva questões gratuitamente!
Junte-se a mais de 4 milhões de concurseiros!
Assinale a opção que corresponde à correta execução do código
precedente, escrito em Python.
Considerando o código precedente, escrito em Python, assinale a
opção que corresponde à sua correta execução.
A respeito da linguagem R, é correto afirmar que
Em relação aos conceitos do algoritmo k-means, julgue os itens a seguir.
I É importante continuar as iterações do algoritmo k-means até que a mudança na posição dos centroides entre as iterações seja menor que um limite predefinido.
II No coeficiente de silhueta, quanto mais próximo o coeficiente estiver de 1, menor a distância entre os clusters; 0 indica que os dados podem estar no cluster errado; valores negativos sugerem que o ponto está na borda.
III Apesar de um maior número clusters sempre reduzir o SSE (sum of squared errors), isso não significa que mais clusters sempre sejam melhores, pois um número muito grande de clusters pode levar a overfitting do modelo.
Assinale a opção correta.
Em aprendizado de máquina, especialmente em algoritmos de árvores de decisão, é fundamental avaliar como os dados são organizados e classificados em diferentes níveis da árvore. Três conceitos-chave que auxiliam na construção e otimização dessas árvores são o gini impurity, a entropy e o information gain. A respeito desses conceitos, julgue os itens a seguir.
I Gini impurity mede a redução da entropy após a divisão de um conjunto de dados com base em um atributo.
II Entropy mede a quantidade de incerteza ou impureza no conjunto de dados.
III Information gain mede a probabilidade de uma nova instância ser classificada incorretamente, com base na distribuição de classes no conjunto de dados.
Assinale a opção correta.
Considerando a figura precedente, assinale a opção correta em
relação ao algoritmo de SVM (support vector machine).
O seguinte código Python utiliza o algoritmo KNN (k-nearest neighbors) para classificação, em que o parâmetro define o número de vizinhos que o classificador KNN irá considerar para realizar a previsão.
Com base no código precedente, é correto afirmar que, caso o valor de fosse alterado de 3 para 4, o modelo
10 ± 4 representa a estimativa intervalar de 95% de confiança para a média de uma população normal, tendo sido obtida a partir de uma amostra aleatória de tamanho n . Para a obtenção dessa estimativa, considerou-se que a variância populacional fosse conhecida. Em novo levantamento feito sobre essa mesma população, mas, dessa vez, tendo-se quadruplicado o tamanho da amostra (4n), foi obtida média amostral igual a 8.
Nesse caso, se 8 ± ε representar a nova estimativa intervalar de 95% de confiança para a média dessa população, é correto afirmar que ε deverá ser igual a
O conjunto de dados {0, 4, 3, 3, 0} é uma realização de uma amostra aleatória simples retirada de uma população binomial com parâmetros n e p, sendo n = 4 e p uma probabilidade desconhecida.
Com base nessas informações, é correto afirmar que a estimativa de máxima verossimilhança para a probabilidade de ocorrência do valor 2 na população em questão é igual a
Se N for uma variável aleatória que siga uma distribuição normal com média igual a 10 e desvio padrão igual a 5 e se Z =, então a probabilidade de ocorrência do evento “Z = 1,96” será igual a
Supondo-se que a variável aleatória X possa assumir valores 0, 1, 2 ou 3 conforme a função de distribuição de probabilidade P(X = h) = na qual h ∈ {0, 1, 2, 3}, é correto afirmar que o valor esperado de X seja igual a
Um modelo de regressão linear múltipla com dez coeficientes foi ajustado pelo método de mínimos quadrados ordinários, tendo produzido um coeficiente de determinação (R2) igual a 80%.
Nessa hipótese, caso o tamanho da amostra utilizado para esse ajuste tenha sido igual a 46, então o valor correspondente do coeficiente conhecido como “R2 ajustado” deve ter sido igual a
Em um modelo de regressão linear simples na forma y = ax + b + ∈, x representa a variável regressora, y denota a variável resposta e ∈ é um erro aleatório com média zero e variância 100.
Nessa hipótese, considerando-se que â denote o estimador de mínimos quadrados ordinários do coeficiente produzido por uma amostra aleatória de tamanho igual a 101 e que o desvio padrão amostral da variável regressora seja igual a 2, é correto afirmar que o desvio padrão de â será igual a
Um analista pretende ajustar um modelo de regressão linear simples com um intercepto e um coeficiente angular β, utilizando uma amostra de tamanho igual a 402.
Nessa situação, se a razão t correspondente à estimativa de β a ser obtida pelo método de mínimos quadrados ordinários for igual a 20, então o coeficiente de explicação (ou determinação) R2 proporcionado pelo modelo em tela será igual a
A respeito do modelo de séries temporais St = ɛt + ɛt-12 + ɛt-24 + ɛt-36 + ... = no qual t ∈ ℤ representa um índice temporal e εt denota um erro aleatório no instante t, que segue uma distribuição normal com média zero e desvio padrão 5, assinale a opção correta.
Se {yt} for uma série temporal fracamente estacionária descrita pelo modelo na forma yt = 3 + 0,7yt−1 + εt , no qual εt é um ruído branco com média nula e t ∈ ℤ, então o valor esperado da variável yt será igual a
Nos seguintes modelos de séries temporais, Xt representa uma observação e wt denota um ruído branco no instante t ∈ ℤ.
I Xt = Xt-1 − 0,25Xt-2 + wt − 0,5wt-1
II Xt = wt − 0,5wt-1
III Xt = 0,8Xt-1 − 0,5wt
IV Xt = 0,09Xt-2 + wt − 0,3wt-1
Considerando os modelos de séries temporais apresentados,
assinale a opção em que é corretamente indicada a quantidade de
modelos cuja função de autocorrelação apresenta a forma de um
processo autorregressivo de primeira ordem.