Questões de Concurso
Sobre estatística descritiva (análise exploratória de dados) em estatística
Foram encontradas 4.027 questões
Valores outliers, isto é, inválidos para a amostra, como um valor textual em vez de um valor que deveria ser numérico, devem ser identificados na etapa de preparação de dados.
Variáveis quantitativas contínuas podem assumir qualquer valor numérico, mesmo que ele não corresponda a um número inteiro.
O gráfico de dispersão é o mais indicado para representar o relacionamento entre dois conjuntos de dados, como idade e tempo de tela dos usuários.
Em um conjunto de dados com muita variação entre si, a normalização garante um desvio padrão mínimo em relação à média dos valores.
Na análise exploratória de dados, as visualizações multivariadas permitem entender as interações entre diferentes variáveis nos conjuntos de dados.

Tendo como referência a figura precedente, em que diagramas esquemáticos (box-plots) comparam as distribuições das produtividades de três grupos de funcionários de certa empresa, julgue o próximo item.
O desvio padrão da produtividade do grupo A é inferior a 25.

Tendo como referência a figura precedente, em que diagramas esquemáticos (box-plots) comparam as distribuições das produtividades de três grupos de funcionários de certa empresa, julgue o próximo item.
A partir da análise gráfica da figura em apreço, observa-se que a produtividade máxima no grupo B é inferior a 100.

Tendo como referência a figura precedente, em que diagramas esquemáticos (box-plots) comparam as distribuições das produtividades de três grupos de funcionários de certa empresa, julgue o próximo item.
Em comparação ao grupo B, a distribuição da produtividade do grupo C apresenta a maior mediana, indicando que pelo menos 50% de seus valores estão acima da mediana da produtividade observada no grupo B.

De acordo com as frequências indicadas no quadro, a mediana das notas das atividades de todos os alunos é igual a
Uma empresa de mineração de ferro está analisando os dados coletados durante suas operações para melhorar os processos de extração e beneficiamento. O conjunto de dados inclui as seguintes variáveis:
• teor_de_ferro: percentual de ferro presente em amostras do minério.
• toneladas_extraidas: quantidade de minério extraída por turno.
Durante o estudo, foi utilizada a técnica de categorização de dados e, mais especificamente, a discretização de dados. Além disso, os conjuntos de dados presentes nas tabelas 22A6-I e 22A6-II, a seguir, serão utilizados como input de algoritmos de aprendizagem de máquina. Na tabela 22A6-I, as variáveis quantidade de minério e profundidade são dadas em toneladas e em metros, respectivamente, e, na tabela 22A6-II, as variáveis temperatura e precipitação são dadas em graus Celsius e em milímetros, respectivamente.
A partir da situação hipotética precedente, julgue o próximo item.
Para a variável teor_de_ferro, a discretização baseada em intervalos é adequada para classificá-la em categorias como baixo, médio e alto, utilizando faixas predefinidas de percentual de ferro.
Uma empresa de mineração de ferro está analisando os dados coletados durante suas operações para melhorar os processos de extração e beneficiamento. O conjunto de dados inclui as seguintes variáveis:
• teor_de_ferro: percentual de ferro presente em amostras do minério.
• toneladas_extraidas: quantidade de minério extraída por turno.
Durante o estudo, foi utilizada a técnica de categorização de dados e, mais especificamente, a discretização de dados. Além disso, os conjuntos de dados presentes nas tabelas 22A6-I e 22A6-II, a seguir, serão utilizados como input de algoritmos de aprendizagem de máquina. Na tabela 22A6-I, as variáveis quantidade de minério e profundidade são dadas em toneladas e em metros, respectivamente, e, na tabela 22A6-II, as variáveis temperatura e precipitação são dadas em graus Celsius e em milímetros, respectivamente.
A partir da situação hipotética precedente, julgue o próximo item.
Quanto à normalização estatística, na tabela 22A6-I, as variáveis quantidade de minério e profundidade devem ser normalizadas. Já na tabela 22A6-II, não há necessidade de se normalizar as variáveis temperatura e precipitação.
Julgue o item a seguir, relacionado aos fundamentos da teoria estatística.
Se, em uma amostra aleatória, a covariância entre as variáveis X e Y é 256, e a covariância entre as variáveis X e Z é 1.024, então a variável X é mais correlacionada com Z do que com Y.
Uma empresa de mineração de ferro está analisando os dados coletados durante suas operações para melhorar os processos de extração e beneficiamento. O conjunto de dados inclui as seguintes variáveis:
• teor_de_ferro: percentual de ferro presente em amostras do minério.
• toneladas_extraidas: quantidade de minério extraída por turno.
Durante o estudo, foi utilizada a técnica de categorização de dados e, mais especificamente, a discretização de dados. Além disso, os conjuntos de dados presentes nas tabelas 22A6-I e 22A6-II, a seguir, serão utilizados como input de algoritmos de aprendizagem de máquina. Na tabela 22A6-I, as variáveis quantidade de minério e profundidade são dadas em toneladas e em metros, respectivamente, e, na tabela 22A6-II, as variáveis temperatura e precipitação são dadas em graus Celsius e em milímetros, respectivamente.
Tabela 22A6-I
Tabela 22A6-II
A partir da situação hipotética precedente, julgue o próximo item.
Para a variável teor_de_ferro, a discretização baseada em intervalos é adequada para classificá-la em categorias como baixo, médio e alto, utilizando faixas predefinidas de percentual de ferro.
Uma empresa de mineração de ferro está analisando os dados coletados durante suas operações para melhorar os processos de extração e beneficiamento. O conjunto de dados inclui as seguintes variáveis:
• teor_de_ferro: percentual de ferro presente em amostras do minério.
• toneladas_extraidas: quantidade de minério extraída por turno.
Durante o estudo, foi utilizada a técnica de categorização de dados e, mais especificamente, a discretização de dados. Além disso, os conjuntos de dados presentes nas tabelas 22A6-I e 22A6-II, a seguir, serão utilizados como input de algoritmos de aprendizagem de máquina. Na tabela 22A6-I, as variáveis quantidade de minério e profundidade são dadas em toneladas e em metros, respectivamente, e, na tabela 22A6-II, as variáveis temperatura e precipitação são dadas em graus Celsius e em milímetros, respectivamente.
Tabela 22A6-I
Tabela 22A6-II
A partir da situação hipotética precedente, julgue o próximo item.
Quanto à normalização estatística, na tabela 22A6-I, as variáveis quantidade de minério e profundidade devem ser normalizadas. Já na tabela 22A6-II, não há necessidade de se normalizar as variáveis temperatura e precipitação.
Julgue o item subsequente, relativo à visualização de dados.
Gráfico de pizza é a melhor escolha para a visualização de grandes conjuntos de dados complexos.
Julgue o item subsequente, relativo à visualização de dados.
Gráficos de barras são adequados para comparar diferentes categorias de dados.
Julgue o item subsequente, relativo à visualização de dados.
A escolha das cores em um gráfico tem pouca influência na interpretação dos dados.
No que se refere a modelagem estatística de dados, julgue o item subsecutivo.
A modelagem estatística de dados é realiza em cinco etapas, na seguinte sequência: coleta de dados; análise exploratória; análise descritiva; manipulação do banco de dados; e diagnóstico.
