Um projeto de saúde utiliza a biblioteca Pandas, em Python, para analisar dados biométricos. O conjunto de dados é trabalhado em um DataFrame chamado saude_df, com várias colunas representando medidas típicas de saúde, como o peso
e a pressão arterial. Cada linha representa o valor dessas medidas para uma pessoa.
Para selecionar aleatoriamente 20% das linhas do DataFrame e apenas as colunas Peso e Pressão Arterial, pode
ser usada a expressão

Question

Um projeto de saúde utiliza a biblioteca Pandas, em Python, para analisar dados biométricos. O conjunto de dados é trabalhado em um DataFrame chamado saude_df, com várias colunas representando medidas típicas de saúde, como o peso
e a pressão arterial. Cada linha representa o valor dessas medidas para uma pessoa.
Para selecionar aleatoriamente 20% das linhas do DataFrame e apenas as colunas Peso e Pressão Arterial, pode
ser usada a expressão Alternativa A: saude_df['Peso', 'Pressão Arterial'].sample(0.2) Ou Alternativa B: saude_df[['Peso', 'Pressão Arterial']].sample(0.2)  Ou Alternativa C: saude_df.sample(0.2)['Peso', 'Pressão Arterial'] Ou Alternativa D: saude_df.sample(frac=0.2)['Peso', 'Pressão Arterial']  Ou Alternativa E: saude_df.sample(frac=0.2)[['Peso', 'Pressão Arterial']]

Qconcursos · Accepted Answer

Alternativa [E] saude_df.sample(frac=0.2)[['Peso', 'Pressão Arterial']] A alternativa correta é a E: saude_df.sample(frac=0.2)[['Peso', 'Pressão Arterial']].

Vamos entender melhor por que essa alternativa é a correta e por que as outras alternativas estão incorretas.

Análise da Alternativa Correta:

A expressão saude_df.sample(frac=0.2) seleciona aleatoriamente 20% das linhas do DataFrame saude_df. A função .sample() é utilizada para amostrar aleatoriamente um percentual ou um número fixo de linhas de um DataFrame.

O argumento frac=0.2 especifica que queremos selecionar 20% das linhas. Depois de obter essas linhas, utilizamos a notação de colchetes duplos [['Peso', 'Pressão Arterial']] para selecionar as colunas específicas que nos interessam, no caso, as colunas 'Peso' e 'Pressão Arterial'.

Agora, vejamos por que as outras alternativas estão incorretas:

Alternativa A: saude_df['Peso', 'Pressão Arterial'].sample(0.2)
Esta alternativa está incorreta porque a sintaxe saude_df['Peso', 'Pressão Arterial'] não é válida para selecionar múltiplas colunas em um DataFrame. Para selecionar múltiplas colunas, devemos usar colchetes duplos, como saude_df[['Peso', 'Pressão Arterial']]. Além disso, o método .sample() está sendo utilizado com um argumento numérico, o que não é correto. O argumento deve ser frac para indicar uma fração do DataFrame.

Alternativa B: saude_df[['Peso', 'Pressão Arterial']].sample(0.2)
Embora a seleção de colunas esteja correta com a notação de colchetes duplos, a função .sample(0.2) está incorreta, pois o argumento passado para .sample() deve ser frac=0.2 para indicar a fração desejada do DataFrame.

Alternativa C: saude_df.sample(0.2)['Peso', 'Pressão Arterial']
Esta alternativa está incorreta por dois motivos. Primeiro, o uso de .sample(0.2) em vez de frac=0.2 está errado. Segundo, a tentativa de acessar múltiplas colunas usando a notação de colchetes simples não é correta. Precisamos usar colchetes duplos para selecionar mais de uma coluna.

Alternativa D: saude_df.sample(frac=0.2)['Peso', 'Pressão Arterial']
Aqui, o método .sample(frac=0.2) está correto, mas a seleção das colunas 'Peso' e 'Pressão Arterial' utilizando colchetes simples ['Peso', 'Pressão Arterial'] está incorreta. Como mencionado anteriormente, para selecionar múltiplas colunas, devemos usar colchetes duplos [['Peso', 'Pressão Arterial']].

Em resumo, a alternativa E é a correta porque utiliza a função .sample() com o argumento frac=0.2 para selecionar aleatoriamente 20% das linhas do DataFrame e, em seguida, usa a notação de colchetes duplos para selecionar as colunas específicas de interesse.

SEJA VITALÍCIO

SEJA VITALÍCIO

Um projeto de saúde utiliza a biblioteca Pandas, em Python, ...

Gabarito comentado

Clique para visualizar este gabarito

Comentários

Clique para visualizar este comentário

Questões de assuntos semelhantes

Provas relacionadas