Questões de Concurso Sobre estatística
Foram encontradas 11.304 questões
O estimador de máxima verossimilhança de θ é dado por:
Completando o quadro da análise de variância, é possível concluir, usando o teste F ao nível de significância de 5%, que:
(Considerar F3,12;5% = 3,49; F4,12;5% = 3,26)
; em que z0,975 é o quantil (0,975) da distribuição normal padrão.
A respeito do assunto, considere as seguintes afirmativas:
1. Ao incluir a informação do tamanho da população (de 2000 estudantes) no cálculo de n, o número necessário de estudantes na amostra diminui.
2. Se, no cálculo de n, for utilizada a informação de uma pesquisa similar, conduzida há alguns anos, quando 60% dos estudantes eram favoráveis à mudança, então o número necessário de estudantes na amostra aumenta.
3. Supondo-se que o valor calculado de n foi considerado muito alto pelos líderes estudantis, para diminuir o valor de n, uma estratégia adequada seria diminuir o erro amostral para 0,02, mas manter o nível de confiança em 95%.
4. Os líderes estudantis também querem estimar a proporção de estudantes que se sentem representados adequadamente por seu centro acadêmico. Nesse contexto, o tamanho de amostra adequado para atingir ambos os objetivos da pesquisa deve ser igual ao daquele que determina selecionar um maior número de estudantes.
Assinale a alternativa correta.
Pressão intraocular de 243 indivíduos, divididos em cinco grupos:
A figura apresenta cinco gráficos do tipo box-plot, lado a lado. São dados de pressão intraocular (em mmHg) de uma amostra de 243 indivíduos, que foram divididos em cinco grupos, segundo a condição clínica do glaucoma.
(Fonte: Barbetta, P.A. Estatística Aplicada a Ciências Sociais. Editora da UFSC,1994.)
Glaucoma é uma doença ocular causada principalmente pela elevação da pressão intraocular que provoca lesões no nervo ótico e, como consequência, comprometimento visual. Se a doença não for tratada adequadamente, pode levar à cegueira. Ao descrever a figura, pode-se obter uma análise exploratória comparativa dos cinco grupos, com relação à pressão intraocular, conforme características identificáveis no box-plot: localização, dispersão e assimetria dos dados, bem como prováveis dados atípicos.
Considerando as informações apresentadas, assinale a alternativa correta.
valor do conjunto de dados ordenados.
Tabela 1 – Dados ordenados de nível de albumina no sangue
Considerando as informações apresentadas, assinale a alternativa correta.
1,5 2,5 3,0 4,0 4,0 4,0 4,0 4,0 4,0 4,0 5,0 5,0 5,0 5,0 5,0 5,0 5,0 6,0 6,0 6,0 7,0 7,0 7,0 8,0 8,0
Há interesse também em analisar as notas dos alunos separados em dois grupos: i) o grupo de aprovados (A), com notas maiores ou iguais a 5; e ii) o grupo de reprovados (R), com as demais notas.
Considerando as informações apresentadas, assinale a alternativa correta.
Durante os anos 1980, aproximadamente 22.000 médicos com mais de 40 anos concordaram em participar de um estudo de longo prazo chamado Physicians’ Health Study. Uma questão investigada foi se a aspirina ajuda a diminuir a ocorrência de enfarto. Os médicos foram aleatoriamente designados para tomar aspirina ou tomar placebo.
(Disponível em: Agresti, A.; Franklin, C. The Art and Science of Learning from Data. Pearson New International. Edição do Kindle.)
Sobre o delineamento do estudo apresentado, é correto afirmar:
Considere as duas listas de números a seguir.
Lista 1: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11
Lista 2: 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15
Sejam D1 e D2 os desvios padrão das Listas 1 e 2, respectivamente.
É correto concluir que
Assinale a opção que corresponde ao teste estatístico que deve ser aplicado para detectar se há diferença significativa quanto à concentração do peptídeo entre quaisquer dos tipos de plantas, sendo este capaz de detectar a diferença se aplicado e calculado apenas uma vez, sem repetições do teste.
I. Vetores (vectors) são listas de itens que devem ter o mesmo tipo.
II. R trabalha com vários tipos de dados (data types), numéricos, lógicos e textuais, mas as variáveis podem mudar de tipo mesmo depois da instanciação.
III. Os itens de uma lista (list) não podem ser substituídos. São permitidas apenas a inserção e a remoção de itens.
Está correto somente o que se afirma em:
for (x in 1:10) { if (x >= 4) { print(x) next } if (x == 8) {break} }
O número de linhas exibidas pela execução desse código é:
Considerando o problema acima descrito, a alternativa que apresenta uma técnica usada para sua resolução é:
O analista respondeu corretamente:
v(w)i = tf(w, di) ∙ idf(w, D)
onde v é o vetor correspondente à palavra w, di é o i-ésimo documento da coleção D de artigos da Wikipédia, ordenados alfabeticamente por título, e tf e idf são, respectivamente, as funções de frequência de termo e inverso da frequência em documentos.
A alternativa que classifica corretamente o modelo acima descrito e apresenta a razão correta para a classificação é:
A alternativa que contém apenas tarefas que sejam exemplos de classificação de documentos é:
A matriz de distância inicial entre os elementos é apresentada a seguir.
Considerando essas informações, a matriz de distância obtida após o primeiro passo do agrupamento é: