Questões de Estatística - Estatística descritiva (análise exploratória de dados) para Concurso

Foram encontradas 3.852 questões

Q3075367 Estatística
O setor de RH da Empresa X, organizou a quantidade de faltas em um bimestre de seus funcionários na tabela seguinte:
Imagem associada para resolução da questão
De acordo com os dados da tabela, a mediana do número de faltas é igual a:
Alternativas
Q3055894 Estatística

Um grupo é formado por jovens cujas idades variam entre 16 e 19 anos. O gráfico a seguir representa a distribuição do número (N) de jovens de acordo com suas idades.  



Imagem associada para resolução da questão




O gráfico de setores que reapresenta, em forma percentual, as frequências das idades desse grupo de jovens é 

Alternativas
Q3055893 Estatística

Originalmente, uma distribuição possuía cinco dados:



2      7     11    5    3



Um sexto dado foi inserido, de modo que a nova distribuição passou a ter moda e mediana iguais.


Qual foi o sexto dado inserido?


Alternativas
Q3055892 Estatística
Considere a seguinte distribuição de dados:

67  34  76  14  24  18  28  42  71

A soma dos três quartis dessa distribuição é igual a
Alternativas
Q3055891 Estatística
Um banco oferece dois serviços aos seus clientes. Sabe-se, no entanto, que 20% dos clientes não contratam qualquer um deles, 50% contratam apenas um e os 30% restantes contratam os dois serviços oferecidos.
Qual é a média do número de serviços contratados pelos clientes desse banco?
Alternativas
Q3051319 Estatística

Muitas vezes é interessante resumir os resultados, apresentando um ou alguns valores que sejam representativos da série, ou ainda algum critério que mensure a dispersão dos dados em torno de sua média. É nesse contexto que estão inseridas as medidas-resumo. A esse respeito, considere as afirmativas abaixo.


I - Como a variância é uma medida de dimensão igual ao quadrado da dimensão dos dados, costuma-se utilizar o desvio padrão para não incorrer em problemas de interpretação.


II - A moda é a observação que ocupa a posição central da série.


III - A média, a mediana, a moda e o desvio padrão são as medidas de posição (ou localização) mais utilizadas para descrever o comportamento de uma série.


Está correto o que se afirma em

Alternativas
Q3048871 Estatística
Em uma agência bancária, todos os dez técnicos de umsetor foram avaliados, segundo alguns critérios, considerando-se uma escala de pontos. Cada técnico recebeuuma numeração única de 1 a 10. Ao final do processo,o total de pontos obtidos por cada um dos 10 técnicos foitabulado conforme a Tabela a seguir. Para medir a dispersão desses dados, o gerente usou o coeficiente de variação, que é a razão entre o desvio padrão e a média dessapopulação.

Q30.png (420×60)

O coeficiente de variação dessa população é igual a
Dado √31 ≅ 5 6
Alternativas
Q3048870 Estatística
Uma agência bancária está analisando dois Serviços,o F e o G, da linha PREMIUM, e, para isso, seus funcionários entrevistaram cinco clientes, com esse perfil, queusaram os dois serviços. Esses clientes atribuíram notasde satisfação de 0,0 a 10,0 para cada serviço. As notaspara o Serviço F e para o Serviço G foram as seguintes:

Serviço F: 7, 9, 8, 6, 10 Serviço G: 8, 7, 9, 5, 10

A gestão dessa agência quer saber qual serviço apresenta maior variabilidade nas notas de satisfação. Para isso,o desvio padrão das notas de ambos os serviços foi calculado.

Considerando-se essa população, formada por esses cinco clientes, e sabendo-se que o desvio padrão das notasdo Serviço G é igual a 1,87, a diferença entre o maior e omenor desvio padrão é igual a

Dado 2√2 ≅ 2 8, 2 
Alternativas
Q3048801 Estatística
O Fundo de Garantia do Tempo de Serviço (FGTS), administrado pela Caixa Econômica Federal (CEF), é um fundo que almeja proteger o trabalhador que for demitido sem justa causa. Na Tabela a seguir, encontram-se os resultados desse fundo entre 2016 e 2022, bem como os valores distribuídos aos trabalhadores nesse período. Todos os valores estão em bilhões de reais.

Q20.png (401×216)

Um superintendente da CEF deseja saber qual é a fração do Resultado total que foi distribuído. Para isso, calculou quanto a média do Resultado distribuído representava em relação à mediana do Resultado total, no período apresentado na Tabela.

A razão entre a média do Resultado distribuído e a mediana do Resultado total é, aproximadamente,
Alternativas
Q3048799 Estatística
Um grupo de 100 funcionários de uma empresa ganhou na Mega-Sena, e o prêmio foi dividido igualmente entre esses funcionários e depositado em suas respectivas contas-correntes.

Considerando-se as medidas de dispersão dos saldos dessas contas, a única dessas medidas que foi alterada após o depósito do prêmio da Mega-Sena foi a(o)
Alternativas
Q3048797 Estatística
Instituições financeiras realizam empréstimos na expectativa de receberem de volta o valor do empréstimo acrescido de juros. Nem sempre, todavia, o cliente paga ao banco o valor que lhe é devido, e isso se denomina inadimplência. A probabilidade de um cliente inadimplir varia de acordo com as características do cliente, como renda, idade ou se o cliente possui casa própria. Quando um cliente solicita um empréstimo, um modelo matemático utiliza essas características para estimar a probabilidade de o cliente inadimplir. Essa probabilidade estimada será usada para classificar o cliente conforme o seu risco de crédito. Esse risco pode variar de AA (para clientes cuja probabilidade de inadimplir é quase nula), passando por B, C, D, E, F, G e finalmente H, à medida que a probabilidade de inadimplência vai aumentando. Segundo a apresentação de resultados do terceiro trimestre de 2023, a Caixa Econômica Federal tem 92,7% de sua carteira com risco de crédito entre AA e C e encerrou 2023 com uma inadimplência de 2,16%.

A variável risco de crédito descrita acima é uma variável
Alternativas
Q3048115 Estatística
Uma equipe precisa apresentar os resultados de diversas análises para diferentes públicos. Cada visualização deve ser escolhida e projetada de forma a comunicar claramente os insights obtidos, considerando as boas práticas de design e de acessibilidade.
Serão apresentados, em momentos diferentes, os seguintes dados:

1. Distribuição de idades de uma pesquisa populacional, que possui um grande número de participantes.
2. Comparação de receitas mensais de diferentes setores de uma empresa ao longo de um ano.
3. Proporção de vendas de diferentes produtos de uma loja durante o último trimestre.
4. Análise de correlação entre as variáveis “horas de estudo” e “nota final” de estudantes.

Considerando-se as boas práticas de design e acessibilidade, quais tipos de gráficos devem ser utilizados para a visualização dessas quatro situações?
Alternativas
Q3048110 Estatística
Uma equipe de análise de riscos de um banco de investimentos precisa avaliar o risco de diferentes carteiras de clientes, que possuem ativos em escalas variadas. Para isso, ela decidiu utilizar modelos de aprendizado de máquina, a fim de auxiliar o seu processo de tomada de decisão. Os analistas da equipe perceberam que parte dos ativos disponíveis poderia influenciar desproporcionalmente a análise de risco. Assim, decidiram aplicar a técnica de normalização z-score. Com essa medida, pretendem reduzir a influência de uma variação abrupta no treinamento dos modelos de aprendizado de máquina, promovendo uma comparação justa entre os ativos e uma avaliação mais precisa do risco em cada carteira. Considere que W seja o conjunto de todos os valores em reais dos ativos de carteiras de investimentos que a equipe de analistas precisa avaliar.
Uma das características da normalização z-score é que, em sua definição original (clássica), essa normalização  
Alternativas
Q3040210 Estatística
Uma medida importante para o estudo do risco a ser mensurada é o valor esperado de cada distribuição de probabilidade considerada. Essa medida do valor esperado não demonstra o risco associado a cada proposta de investimento. Ao quantificar o risco do investimento, deve-se utilizar medida estatística de
Alternativas
Q3040169 Estatística
O uso de dados quantitativos e qualitativos é fundamental para a compreensão e a análise da situação de um país, servindo de importante subsídio à tomada de decisões. Esses dados são mensurados a partir de diferentes variáveis. Sobre essas variáveis, verifica-se que
Alternativas
Q3029120 Estatística
Duas instâncias A e B de um dataset de tweets são representadas, respectivamente, por intermédio dos vetores
xA = [2, −2, 0, 1,] e xB = [−4, 0, 2, −4].
Os valores da similaridade de cosseno e da distância de Manhattan entre essas duas instâncias são, respectivamente: 
Alternativas
Q3029112 Estatística
Anderson, analista de dados do TRF-1, gerou a matriz de confusão abaixo a partir dos resultados obtidos com um classificador binário.

Imagem associada para resolução da questão


Ao calcular a F1-score ponderada para esse classificador, Anderson obteve o valor:
Alternativas
Q3028905 Estatística
Em um estudo do efeito da temperatura sobre o crescimento microbiano no leite, avaliou-se o número de germes/cm3 para diferentes temperaturas. Descreveu-se o logaritmo do número de germes (Y) como uma função da temperatura (X), pela equação Y =3,06 + 0,11X. Na análise, o valor da estatística F foi 93,5. Sabendo que foram realizadas nove observações, podemos afirmar que o valor do coeficiente de determinação r2 é igual a: 
Alternativas
Q3028904 Estatística
No tocante à correlação linear simples, sabe-se que o coeficiente de correlação linear (r) é uma medida do grau de associação entre duas variáveis como, por exemplo, X1 e X2. Por sua interpretação, constata-se que: 
Alternativas
Respostas
1: D
2: A
3: C
4: C
5: C
6: A
7: D
8: C
9: B
10: E
11: E
12: D
13: D
14: E
15: C
16: C
17: C
18: D
19: D
20: A