Questões de Concurso
Sobre estatística descritiva (análise exploratória de dados) em estatística
Foram encontradas 4.081 questões

Tendo como referência a figura precedente, em que diagramas esquemáticos (box-plots) comparam as distribuições das produtividades de três grupos de funcionários de certa empresa, julgue o próximo item.
O desvio padrão da produtividade do grupo A é inferior a 25.

Tendo como referência a figura precedente, em que diagramas esquemáticos (box-plots) comparam as distribuições das produtividades de três grupos de funcionários de certa empresa, julgue o próximo item.
A partir da análise gráfica da figura em apreço, observa-se que a produtividade máxima no grupo B é inferior a 100.

Tendo como referência a figura precedente, em que diagramas esquemáticos (box-plots) comparam as distribuições das produtividades de três grupos de funcionários de certa empresa, julgue o próximo item.
Em comparação ao grupo B, a distribuição da produtividade do grupo C apresenta a maior mediana, indicando que pelo menos 50% de seus valores estão acima da mediana da produtividade observada no grupo B.
O gráfico a seguir apresenta informações de uma indústria de determinada peça para veículos, a respeito dos números de peças fabricadas e reprovadas (após a fabricação) nos últimos três meses de 2024.
A média mensal do número de peças fabricadas e não reprovadas no último trimestre de 2024 nessa indústria foi igual a
O gráfico a seguir representa a distribuição das respostas dadas a uma pergunta, sendo que cada respondente escolheu apenas uma das alternativas, A, B ou C.
Sabendo que o setor correspondente à resposta C tem um ângulo central de 60º, pode-se concluir corretamente que o número total de respondentes à pergunta foi igual a

De acordo com as frequências indicadas no quadro, a mediana das notas das atividades de todos os alunos é igual a
Uma empresa de mineração de ferro está analisando os dados coletados durante suas operações para melhorar os processos de extração e beneficiamento. O conjunto de dados inclui as seguintes variáveis:
• teor_de_ferro: percentual de ferro presente em amostras do minério.
• toneladas_extraidas: quantidade de minério extraída por turno.
Durante o estudo, foi utilizada a técnica de categorização de dados e, mais especificamente, a discretização de dados. Além disso, os conjuntos de dados presentes nas tabelas 22A6-I e 22A6-II, a seguir, serão utilizados como input de algoritmos de aprendizagem de máquina. Na tabela 22A6-I, as variáveis quantidade de minério e profundidade são dadas em toneladas e em metros, respectivamente, e, na tabela 22A6-II, as variáveis temperatura e precipitação são dadas em graus Celsius e em milímetros, respectivamente.
A partir da situação hipotética precedente, julgue o próximo item.
Para a variável teor_de_ferro, a discretização baseada em intervalos é adequada para classificá-la em categorias como baixo, médio e alto, utilizando faixas predefinidas de percentual de ferro.
Uma empresa de mineração de ferro está analisando os dados coletados durante suas operações para melhorar os processos de extração e beneficiamento. O conjunto de dados inclui as seguintes variáveis:
• teor_de_ferro: percentual de ferro presente em amostras do minério.
• toneladas_extraidas: quantidade de minério extraída por turno.
Durante o estudo, foi utilizada a técnica de categorização de dados e, mais especificamente, a discretização de dados. Além disso, os conjuntos de dados presentes nas tabelas 22A6-I e 22A6-II, a seguir, serão utilizados como input de algoritmos de aprendizagem de máquina. Na tabela 22A6-I, as variáveis quantidade de minério e profundidade são dadas em toneladas e em metros, respectivamente, e, na tabela 22A6-II, as variáveis temperatura e precipitação são dadas em graus Celsius e em milímetros, respectivamente.
A partir da situação hipotética precedente, julgue o próximo item.
Quanto à normalização estatística, na tabela 22A6-I, as variáveis quantidade de minério e profundidade devem ser normalizadas. Já na tabela 22A6-II, não há necessidade de se normalizar as variáveis temperatura e precipitação.
Julgue o item a seguir, relacionado aos fundamentos da teoria estatística.
Se, em uma amostra aleatória, a covariância entre as variáveis X e Y é 256, e a covariância entre as variáveis X e Z é 1.024, então a variável X é mais correlacionada com Z do que com Y.
Uma empresa de mineração de ferro está analisando os dados coletados durante suas operações para melhorar os processos de extração e beneficiamento. O conjunto de dados inclui as seguintes variáveis:
• teor_de_ferro: percentual de ferro presente em amostras do minério.
• toneladas_extraidas: quantidade de minério extraída por turno.
Durante o estudo, foi utilizada a técnica de categorização de dados e, mais especificamente, a discretização de dados. Além disso, os conjuntos de dados presentes nas tabelas 22A6-I e 22A6-II, a seguir, serão utilizados como input de algoritmos de aprendizagem de máquina. Na tabela 22A6-I, as variáveis quantidade de minério e profundidade são dadas em toneladas e em metros, respectivamente, e, na tabela 22A6-II, as variáveis temperatura e precipitação são dadas em graus Celsius e em milímetros, respectivamente.
Tabela 22A6-I
Tabela 22A6-II
A partir da situação hipotética precedente, julgue o próximo item.
Para a variável teor_de_ferro, a discretização baseada em intervalos é adequada para classificá-la em categorias como baixo, médio e alto, utilizando faixas predefinidas de percentual de ferro.
Uma empresa de mineração de ferro está analisando os dados coletados durante suas operações para melhorar os processos de extração e beneficiamento. O conjunto de dados inclui as seguintes variáveis:
• teor_de_ferro: percentual de ferro presente em amostras do minério.
• toneladas_extraidas: quantidade de minério extraída por turno.
Durante o estudo, foi utilizada a técnica de categorização de dados e, mais especificamente, a discretização de dados. Além disso, os conjuntos de dados presentes nas tabelas 22A6-I e 22A6-II, a seguir, serão utilizados como input de algoritmos de aprendizagem de máquina. Na tabela 22A6-I, as variáveis quantidade de minério e profundidade são dadas em toneladas e em metros, respectivamente, e, na tabela 22A6-II, as variáveis temperatura e precipitação são dadas em graus Celsius e em milímetros, respectivamente.
Tabela 22A6-I
Tabela 22A6-II
A partir da situação hipotética precedente, julgue o próximo item.
Quanto à normalização estatística, na tabela 22A6-I, as variáveis quantidade de minério e profundidade devem ser normalizadas. Já na tabela 22A6-II, não há necessidade de se normalizar as variáveis temperatura e precipitação.
Julgue o item subsequente, relativo à visualização de dados.
Gráfico de pizza é a melhor escolha para a visualização de grandes conjuntos de dados complexos.
Julgue o item subsequente, relativo à visualização de dados.
Gráficos de barras são adequados para comparar diferentes categorias de dados.
Julgue o item subsequente, relativo à visualização de dados.
A escolha das cores em um gráfico tem pouca influência na interpretação dos dados.
No que se refere a modelagem estatística de dados, julgue o item subsecutivo.
A modelagem estatística de dados é realiza em cinco etapas, na seguinte sequência: coleta de dados; análise exploratória; análise descritiva; manipulação do banco de dados; e diagnóstico.

As tabelas precedentes mostram as estimativas dos coeficientes e seus respectivos erros padrão proporcionados pelo método de mínimos quadrados ordinários em um modelo de regressão linear com um intercepto e 4 variáveis regressoras (X1, X2, X3 e X4) para modelar uma variável dependente Y. As tabelas mostram, ainda, o tamanho da amostra, o coeficiente de determinação (R2 ) e o erro quadrático médio desse modelo, que foi igual a 36. Com base nessas informações e nos dados das tabelas, julgue o item subsequente.
O coeficiente de explicação deverá aumentar se a variável X2 for retirada do modelo.
As tabelas precedentes mostram as estimativas dos coeficientes e seus respectivos erros padrão proporcionados pelo método de mínimos quadrados ordinários em um modelo de regressão linear com um intercepto e 4 variáveis regressoras (X1, X2, X3 e X4) para modelar uma variável dependente Y. As tabelas mostram, ainda, o tamanho da amostra, o coeficiente de determinação (R2 ) e o erro quadrático médio desse modelo, que foi igual a 36. Com base nessas informações e nos dados das tabelas, julgue o item subsequente.
A variância amostral da variável dependente Y é superior a 85.
As tabelas precedentes mostram as estimativas dos coeficientes e seus respectivos erros padrão proporcionados pelo método de mínimos quadrados ordinários em um modelo de regressão linear com um intercepto e 4 variáveis regressoras (X1, X2, X3 e X4) para modelar uma variável dependente Y. As tabelas mostram, ainda, o tamanho da amostra, o coeficiente de determinação (R2 ) e o erro quadrático médio desse modelo, que foi igual a 36. Com base nessas informações e nos dados das tabelas, julgue o item subsequente.
O desvio padrão dos resíduos do modelo de regressão é igual a 6.