Questões de Estatística para Concurso
Foram encontradas 2.026 questões
I. Dado dois conjuntos de registros com N e M registros (onde N<<M) vinculados a duas classes, o balanceamento por seleção aleatória ocorre selecionando de forma aleatória N registros dentro do conjunto contendo M registros.
II. Dado dois conjuntos de registros com N e M registros (onde N<<M) vinculados a duas classes, o balanceamento por seleção de grupo ocorre selecionando por meio de uma técnica de agrupamento os N registros mais representativos dentro do conjunto contendo M registros.
III. Dado dois conjuntos de registros com N e M registros (onde N<<M) vinculados a duas classes, o balanceamento ocorre gerando artificialmente instâncias a partir das instâncias do conjunto contendo M registros (classe maioritária).
Quais estão INCORRETAS?
I. Em modelos de aprendizado de máquina do tipo classificação a ideia é prever variáveis categóricas, e numéricas.
II. Um exemplo básico de aprendizado de máquina supervisionado por classificação é o uso da regressão logística.
III. Os modelos de regressão não buscam encontrar como uma variável se comporta na medida em que outra variável sofre oscilações.
IV. Nos modelos de aprendizagem de máquina supervisionado, não temos uma variável específica a ser respondida, pois estamos apenas buscando encontrar os indivíduos, itens ou elementos semelhantes.
• Idade.
• Renda.
• Estado Civil.
• Escolaridade.
• Número de Aparelhos de TV na Residência.
• Grau de Satisfação sobre a TV a Cabo (1 – Péssimo a 5 – Ótimo).
A classificação correta dessas seis variáveis é:
I Quando se adiciona variáveis explicativas no modelo de regressão linear, espera-se o incremento da estatística R2 .
II Ao se comparar modelos com diferentes quantidades de variáveis explicativas, deve-se analisar o valor de R2 ajustado.
III O aumento de variáveis explicativas aumenta o R2 ajustado.
IV Ao se estimar um modelo com quatro variáveis explicativas e compará-lo com um modelo com três variáveis explicativas, escolhe-se o modelo que retornar o maior valor de R2 ajustado, tudo o mais constante.
Estão corretos apenas os itens
Suponha que sejam medidos 16 lotes na fábrica A e 61 lotes na fábrica B, e que as médias amostrais tenham sido A_bar = 104 e B_bar = 112, com somas de desvios quadráticos em relação à média S^2_A = 40.000 e S^2_B = 100.000, respectivamente.
A chefia quer saber se uma fábrica tem menor variabilidade em relação à outra.
O teste a ser usado e o valor da sua estatística de teste são, respectivamente:
Quando queremos entender a associação de um fator com um evento de interesse, em geral computamos a razão de chances, r = c_0/c_1, onde c_0 é a chance sem a exposição e c_1 é a chance com a exposição.
Suponha que um analista dispõe de um conjunto de dados binários Y = (Y_1,..., Y_n), com Y_i tomando valores em {0, 1} contendo o resultado de um teste de Covid-19 em n pacientes e que X = (X_1, ..., X_n) é um conjunto de covariáveis também binárias que indicam se o indivíduo foi (X_i = 1) ou não (X_i = 0) a uma festa nos últimos dez dias.
O analista quer determinar se a variável X está significativamente associada com o resultado do teste, Y.
Para tanto, ajusta um modelo de regressão logística utilizando Y como variável resposta, um termo de intercepto e X como covariável.
Ele obtém uma estimativa b0 para o intercepto, com erro padrão s0 e, para o coeficiente de X, uma estimativa b1 erro padrão s1.
O intervalo de confiança de 90% para a razão de chances é:
Considere as duas listas de números a seguir.
Lista 1: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11
Lista 2: 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15
Sejam D1 e D2 os desvios padrão das Listas 1 e 2, respectivamente.
É correto concluir que
Assinale a opção que corresponde ao teste estatístico que deve ser aplicado para detectar se há diferença significativa quanto à concentração do peptídeo entre quaisquer dos tipos de plantas, sendo este capaz de detectar a diferença se aplicado e calculado apenas uma vez, sem repetições do teste.
I. Vetores (vectors) são listas de itens que devem ter o mesmo tipo.
II. R trabalha com vários tipos de dados (data types), numéricos, lógicos e textuais, mas as variáveis podem mudar de tipo mesmo depois da instanciação.
III. Os itens de uma lista (list) não podem ser substituídos. São permitidas apenas a inserção e a remoção de itens.
Está correto somente o que se afirma em:
for (x in 1:10) { if (x >= 4) { print(x) next } if (x == 8) {break} }
O número de linhas exibidas pela execução desse código é:
O analista respondeu corretamente:
A alternativa que contém apenas tarefas que sejam exemplos de classificação de documentos é:
No boxplot acima, os valores das estatísticas nas posições indicadas pelas letras A, B, C, D, E e F são:
Segundas 6 Terças 12 Quartas 9 Quintas 8 Sextas 15 Sábados 13 Domingos 7
Realizando um teste estatístico adequado para verificar se essas autuações ocorrem com a mesma frequência, teremos:
Tendo como padrão um grau de confiança de 95%, o tamanho da amostra necessário para garantir o processo é:
É correto afirmar que o modelo apresenta:
A estimativa do erro padrão da mediana amostral é, aproximadamente:
O tamanho mínimo da amostra da população das mulheres que se pretende com probabilidade pelo menos 0,95 e cuja diferença em valor absoluto entre a média amostral e a média populacional não exceda 0,1 é, aproximadamente:
O percentual de variação observado nas alterações anuais do índice que é explicado pela relação linear com a alteração de janeiro é: