No que se refere à biblioteca Pandas, julgue o próximo item....
No que se refere à biblioteca Pandas, julgue o próximo item.
import pandas as pd
a = [10, 78, 23]
myvar = pd.Series(a, index = [“x”, “y”, “z”])
print(myvar.describe())
Caso o código em Python precedente seja executado, então será apresentado em tela o que se segue.
count 4.000000
mean 38.000000
std 6.097091
min 10.000000
25% 16.500000
50% 23.000000
75% 50.500000
max 78.000000
dtype: float64
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
Alternativa correta: E - Errado.
Vamos entender o motivo pelo qual a questão está errada. A biblioteca Pandas é uma das principais ferramentas utilizadas em análise de dados com a linguagem Python. Uma de suas estruturas de dados fundamentais é a Série, que pode ser criada a partir de uma lista, como mostrado no código exemplo, associando os valores da lista a um índice explícito.
Quando o método describe()
é invocado em uma Série, ele retorna um resumo estatístico que inclui:
- count: a contagem de elementos não nulos na série,
- mean: a média dos valores,
- std: o desvio padrão,
- min: o valor mínimo,
- 25%: o primeiro quartil (mediana do primeiro meio dos dados),
- 50%: o segundo quartil, também conhecido como a mediana,
- 75%: o terceiro quartil (mediana do segundo meio dos dados), e
- max: o valor máximo.
No código fornecido, a Série é composta por três elementos, portanto, o count deve ser 3 e não 4 como mencionado no enunciado. Além disso, os valores para mean, std, 25%, 50% e 75% devem refletir o conjunto de dados específico [10, 78, 23], os quais seriam diferentes dos valores apresentados na saída do enunciado.
O erro na questão está principalmente no valor de count que indica um número incorreto de elementos na Série e, portanto, leva a crer que também os outros valores estatísticos apresentados estão associados a uma Série diferente da que foi criada no código.
Ao executar a função describe()
na Série com os elementos [10, 78, 23], seria esperado uma saída com o count sendo 3 e os valores de mean, std, min, 25%, 50%, 75% e max correspondentes aos cálculos estatísticos desses três números.
É importante sempre verificar se a saída esperada condiz com os dados e operações realizadas no código, algo crucial em análises de dados e programação em geral. Portanto, a afirmação está errada, e a alternativa correta é a letra E.
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
count = 3
mean = 37 ...
ERRADO
Da pra matar na primeira, o count conta elementos não nulos, no caso, tem 3, não 4
e-
ja esta errado com count 4.000000. ha 3 elementos
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo