Questões de Concurso Sobre estatística
Foram encontradas 11.304 questões
A sobredispersão, isto é, a variância maior que a média, é uma característica de dados de contagem que não se adequam bem à distribuição de Poisson.
Suponha que os números de gols marcados por um jogador de futebol em dez temporadas tenham sido:
3, 2, 8, 3, 12, 11, 17, 11, 15, 14.
A variância desse conjunto de dados é 19,34.
Sobre a razão R entre a variância observada e a variância esperada sob o modelo Poisson, é correto afirmar que:
A variável aleatória X tem distribuição normal com média 2 e variância 1. Considere a transformação Y = 2*(X – 2).
É correto afirmar que, aproximadamente:
A seguinte amostra de acidentes de trânsito em um mês foi observada:
9, 15, 15, 11, 13, 16, 15, 13, 16, 18, 9.
Nesse caso, é correto afirmar, a respeito das principais medidas de tendência central desse conjunto, que:
Suponha que observamos a seguinte amostra de quantidade de anos de estudo de adultos:
7, 13, 9, 10, 6, 4, 13, 9, 10, 9.
A diferença entre a média e a moda dessa amostra é:
Uma maneira de detectar valores aberrantes (outliers) é considerar observações que estejam a uma distância de 1,5*IQR do primeiro (Q1) ou terceiro (Q3) quartis, onde IQR é o intervalo interquartil da amostra.
Considere a seguinte amostra de quantidade de cachorros-quentes vendidos durante dez dias:
11, 11, 12, 13, 9, 12, 9, 10, 11, 13.
Suponha que numa data posterior tenham sido vendidos cinco cachorros-quentes.
É correto afirmar que este é:
( ) Deve ser utilizado quando as unidades experimentais apresentam heterogeneidade em algum aspecto com potencial influência nas variáveis a serem medidas. ( ) Deve ser utilizado quando o ambiente ou as condições de contorno nas quais estarão as unidades experimentais não apresentarem fatores que as influenciem de forma distinta. ( ) É recomendado em situações onde se corre risco de perder repetições durante o experimento.
Assinale a alternativa que indica a sequência correta, de cima para baixo.
Considere que:
■ As estimativas pelo método de mínimos quadrados ordinários para o coeficiente linear α é igual a 1,5 e, para o coeficiente angular β é de 2,0 e que a variável x não está correlacionada com o erro ε. ■ Os resíduos das amostras envolvidas são independentes e identicamente distribuídos, com distribuição normal, média igual a 0,0 e variância com valor constante. ■ O valor assumido para x é igual a 3,0.
Diante do exposto, assinale a alternativa que traz o valor predito para y.
Um produtor deseja avaliar a qualidade dos cogumelos Shitakes que produz. Assim, considerando que suas mudas desta variedade de cogumelos estão numeradas de 1246 a 1640, ele pretende obter uma amostra sistemática de 50 mudas para este estudo.
Com base na situação exposta, qual é a quantidade total de mudas de cogumelo Shitake que possui este produtor?
Em análise fatorial, fatores são abstrações empíricas que podemos visualizar como eixos de um sistema de coordenadas onde representamos as variáveis.
Identifique abaixo as afirmativas verdadeiras ( V ) e as falsas ( F ) em relação ao assunto.
( ) Considerando a representação gráfica, entende-se por carga fatorial a coordenada de uma variável ao longo do eixo. ( ) As cargas fatoriais podem ser inseridas em uma matriz onde as colunas representam cada fator e as linhas representam as cargas fatoriais de cada uma das variáveis nos fatores. ( ) Em uma boa solução na análise fatorial, esperamos sempre que uma variável tenha carga fatorial baixa no fator ao qual pertence e carga alta nos demais fatores. ( ) Considerando a representação gráfica, se cada eixo do gráfico representa um fator, as coordenadas das variáveis ao longo de cada eixo representam a força da relação entre a variável e cada fator. Em uma situação ideal, uma variável deveria ter uma coordenada alta para um dos eixos e coordenadas baixas para todos os outros eixos, ou seja, para os fatores.
Assinale a alternativa que indica a sequência correta, de cima para baixo
Analise a seguinte situação, observando os dados da do quadro de ANOVA a seguir.
Um criador separou seu rebanho em três grupos, cada um com espécies diferentes: X, Y e Z. Em dado momento, ele resolveu testar se as espécies diferem de peso, ou seja, ele pretende descobrir se há mais variação de peso entre os grupos de cada espécie ou dentro de cada grupo.
Assim, ele tem as seguintes hipóteses estatísticas:
■ H0 Todas as espécies têm o mesmo peso, ou seja, o criador tem menos variação entre os grupos do que dentro dos grupos. ■ H1 As espécies diferem em peso, ou seja, o criador observa mais variação entre os grupos do que dentro dos grupos.
Considerando que o criador adota o seguinte critério de decisão:
■ Se o Fcalculado for menor ou igual ao Fcrítico para α = 0,05, aceita-se a hipótese nula H0. ■ Se o Fcalculado for maior que o Fcrítico para α = 0,05, aceita-se a hipótese alternativa H1.
Assinale a alternativa correta.
Como alternativa ao Tinn-R na correção de códigos podemos utilizar o ......................... , que pode ser aberto diretamente no R, basta utilizar o comando > edit().
Assinale a alternativa que completa corretamente a lacuna do texto.
Com base nestes pressupostos, analise as afirmativas abaixo com relação ao conjunto de dados X.
1. O pressuposto da homocedasticidade é satisfeito quando a variação em torno da reta de regressão aumenta conforme variam os valores de X. 2. O pressuposto da independência de erros é satisfeito quando os erros em torno da reta de regressão são constantes para cada valor de X. 3. O pressuposto da normalidade de erros é satisfeito quando os erros em torno da reta de regressão são distribuídos de forma normal para cada valor de X.
Assinale a alternativa que indica todas as afirmativas corretas.
1. Os experimentos em quadrados latinos são aqueles que levam em consideração os princípios básicos do controle local feito em dois sentidos perpendiculares, em que um deles é chamado de linhas e o outro de colunas. 2. Nos experimentos em quadrados latinos, o número de linhas é igual ao número de colunas que difere por sua vez do número de tratamentos. 3. A variável resposta é avaliada em todas as combinações possíveis de tratamentos.
Assinale a alternativa que indica todas as afirmativas corretas.
( ) Para utilizar a Regressão logística não são necessárias as suposições de que a amostra tenha urna distribuição normal multivariada e que as matrizes de variância/covariância sejam iguais dento dos grupos. ( ) Tanto a análise discriminante quanto a Regressão Logística têm testes estatísticos diretos, habilidade para incorporar efeitos não lineares, e uma gama extensiva de diagnósticos. ( ) Uma vantagem da regressão logística é que só se precisa saber se um evento (ocorrência ou não, fracasso ou sucesso) aconteceu e podemos dessa forma utilizar um valor dicotômico como variável dependente. O procedimento prediz a estimativa da probabilidade que o evento vai ou não acontecer. ( ) Em vez de minimizar o quadrado dos desvios, a Regressão Logística minimiza a probabilidade de que o evento ocorra.
Assinale a alternativa que indica a sequência correta, de cima para baixo.
Considerando a análise de componentes principais, assinale a alternativa que traz a taxa de variação explicada por autovalor1 e autovalor2.
Analise as afirmativas abaixo sobre a análise discriminante.
1. O método da teoria da decisão estatística pode ser usado para determinar a qual grupo pertence um provável caso e considera que há tantas funções de classificação quanto há grupos. 2. O método do ponto de corte objetiva encontrar o escore discriminante ou valor de corte, que divide o espaço discriminante em regiões mutuamente exclusivas e exaustivas. 3. No método do ponto de corte, o valor de corte selecionado é aquele que minimiza o número de classificações incorretas 4. O método da teoria da decisão estatística é baseado na teoria de Bayes e consiste em minimizar os erros de classificações corretas levando em consideração os custos da classificação correta.
Assinale a alternativa que indica todas as afirmativas corretas.
Considerando que c é uma constante, assinale a alternativa que apresenta o valor correto da variância de Y.
Analise as afirmativas abaixo sobre a análise multivariada.
1. O critério varimax, na análise fatorial, é um método de rotação fatorial ortogonal que minimiza o número de variáveis que têm altas cargas em um fator, simplificando a interpretação dos fatores. 2. O princípio da análise de correlação canônica busca identificar e quantificar a associação entre dois conjuntos de variáveis, desenvolvendo uma combinação linear de cada conjunto de variáveis, dependentes e independentes, com o objetivo de maximizar a correlação entre os dois conjuntos. 3. Um dos objetivos da análise discriminante é estabelecer o número e a composição da dimensão da discriminação entre os grupos formados pelo conjunto de variáveis independentes.
Assinale a alternativa que indica todas as afirmativas corretas.
A tabela a seguir apresenta as cargas fatoriais correspondentes a essas variáveis e as respectivas comunalidades.
Restringindo-se aos dois primeiros fatores:
Assinale a alternativa que contém a expressão estatística utilizada como base para o gráfico de controle T2 de Hotelling.