Questões de Concurso Sobre estatística
Foram encontradas 11.639 questões
I. Dado dois conjuntos de registros com N e M registros (onde N<<M) vinculados a duas classes, o balanceamento por seleção aleatória ocorre selecionando de forma aleatória N registros dentro do conjunto contendo M registros.
II. Dado dois conjuntos de registros com N e M registros (onde N<<M) vinculados a duas classes, o balanceamento por seleção de grupo ocorre selecionando por meio de uma técnica de agrupamento os N registros mais representativos dentro do conjunto contendo M registros.
III. Dado dois conjuntos de registros com N e M registros (onde N<<M) vinculados a duas classes, o balanceamento ocorre gerando artificialmente instâncias a partir das instâncias do conjunto contendo M registros (classe maioritária).
Quais estão INCORRETAS?
I. Em modelos de aprendizado de máquina do tipo classificação a ideia é prever variáveis categóricas, e numéricas.
II. Um exemplo básico de aprendizado de máquina supervisionado por classificação é o uso da regressão logística.
III. Os modelos de regressão não buscam encontrar como uma variável se comporta na medida em que outra variável sofre oscilações.
IV. Nos modelos de aprendizagem de máquina supervisionado, não temos uma variável específica a ser respondida, pois estamos apenas buscando encontrar os indivíduos, itens ou elementos semelhantes.
• Idade.
• Renda.
• Estado Civil.
• Escolaridade.
• Número de Aparelhos de TV na Residência.
• Grau de Satisfação sobre a TV a Cabo (1 – Péssimo a 5 – Ótimo).
A classificação correta dessas seis variáveis é:
Considere o conjunto de valores: {∛8, √225, √0,25, ∛0,125, ∛135}. Qual o valor modal desse conjunto?
I Quando se adiciona variáveis explicativas no modelo de regressão linear, espera-se o incremento da estatística R2 .
II Ao se comparar modelos com diferentes quantidades de variáveis explicativas, deve-se analisar o valor de R2 ajustado.
III O aumento de variáveis explicativas aumenta o R2 ajustado.
IV Ao se estimar um modelo com quatro variáveis explicativas e compará-lo com um modelo com três variáveis explicativas, escolhe-se o modelo que retornar o maior valor de R2 ajustado, tudo o mais constante.
Estão corretos apenas os itens
Suponha que sejam medidos 16 lotes na fábrica A e 61 lotes na fábrica B, e que as médias amostrais tenham sido A_bar = 104 e B_bar = 112, com somas de desvios quadráticos em relação à média S^2_A = 40.000 e S^2_B = 100.000, respectivamente.
A chefia quer saber se uma fábrica tem menor variabilidade em relação à outra.
O teste a ser usado e o valor da sua estatística de teste são, respectivamente:
7,6 4,1 8,8 4,2 5,1 7,4 8,8 5,9 3,1
Sabendo-se que a média amostral do conjunto completo é x_bar = 4,2, a amplitude dos dados é:
Quando queremos entender a associação de um fator com um evento de interesse, em geral computamos a razão de chances, r = c_0/c_1, onde c_0 é a chance sem a exposição e c_1 é a chance com a exposição.
Suponha que um analista dispõe de um conjunto de dados binários Y = (Y_1,..., Y_n), com Y_i tomando valores em {0, 1} contendo o resultado de um teste de Covid-19 em n pacientes e que X = (X_1, ..., X_n) é um conjunto de covariáveis também binárias que indicam se o indivíduo foi (X_i = 1) ou não (X_i = 0) a uma festa nos últimos dez dias.
O analista quer determinar se a variável X está significativamente associada com o resultado do teste, Y.
Para tanto, ajusta um modelo de regressão logística utilizando Y como variável resposta, um termo de intercepto e X como covariável.
Ele obtém uma estimativa b0 para o intercepto, com erro padrão s0 e, para o coeficiente de X, uma estimativa b1 erro padrão s1.
O intervalo de confiança de 90% para a razão de chances é:
E = (E_1, E_2, ..., E_10) da quantidade X e deseja avaliar o estimador que as produziu.
Conhecendo o valor verdadeiro de X, ele computa o erro quadrático médio, cujo valor foi 64.
Já a soma das estimativas foi 1.000 e a soma de seus quadrados foi 5.100.
O valor absoluto do viés do estimador é:
Situação hipotética 17A4-I
Um padrão de referência possui concentração de 25 mg/mL da substância X. Um técnico, ao calibrar dois aparelhos que medem a concentração desta substância X, fez medidas durante 5 dias (amostra 1 no dia 1, amostra 2 no dia 2, e assim por diante) e encontrou os seguintes valores.
Amostras 1 2 3 4
Teor de ferro ( ppm) 118 113 107 102
Considerando o valor de tα/2 igual a 3,182 e α = 0,10, assinale a opção correta para o intervalo de confiança calculado para o teor de ferro no material de referência preparado.

sendo πi = P(Yi = 1|xi). Com base no modelo ajustado, a probabilidade estimada de um paciente do grupo tratado estar curado do problema de pele é igual a:
y = β0 + β1x1 + ... + βkxk + ∈, ∈ ~ N(0,σ2),
em que x1,...,xk denota as k variáveis a serem inseridas no modelo (eventualmente, resultantes do produto das variáveis originais). Nesse caso, k é igual a: