Questões de Concurso Público Petrobras 2022 para Ciência de Dados

Foram encontradas 120 questões

Q1895653 Engenharia de Software

Imagem associada para resolução da questão


Julgue o próximo item, considerando o gráfico precedente, que representa as regiões de overfitting e de underfitting, permitindo uma avaliação do relacionamento da complexidade do modelo de aprendizagem de máquina adotado, com o erro de predição. 



Considerando que a variância é um erro de sensibilidade para pequenas flutuações no conjunto de treinamento, infere-se que um baixo nível de variância pode fazer que o algoritmo associado a um modelo de aprendizado de máquina perca as relações relevantes entre os atributos de entrada e a variável de saída, caracterizando o erro de overfitting, percebido na região à direita do ponto A.

Alternativas
Q1895654 Engenharia de Software

Imagem associada para resolução da questão


Julgue o próximo item, considerando o gráfico precedente, que representa as regiões de overfitting e de underfitting, permitindo uma avaliação do relacionamento da complexidade do modelo de aprendizagem de máquina adotado, com o erro de predição. 



Quando se verifica um alto erro no treinamento com valor próximo ao erro na validação, percebido na região à esquerda do ponto A, tem-se um clássico problema de underfitting, caracterizado pelo alto valor do bias

Alternativas
Q1895655 Estatística
Uma determinada repartição pública fez um levantamento do tempo y,  em minutos, que os cinco funcionários de uma sessão gastam para chegar ao trabalho em função da distância x, em quilômetros, de suas residências. O resultado da pesquisa realizada com cada um deles é apresentado na tabela a seguir, em que  respectivamente, as médias amostrais das variáveis x e y.


Com base nos dados dessa tabela, julgue o próximo item.


Uma forma de melhorar o modelo de regressão linear para a situação em questão é utilizar o modelo de regressão logística, uma vez que a variável dependente se apresenta de forma quantitativa.  

Alternativas
Q1895656 Estatística
Uma determinada repartição pública fez um levantamento do tempo y,  em minutos, que os cinco funcionários de uma sessão gastam para chegar ao trabalho em função da distância x, em quilômetros, de suas residências. O resultado da pesquisa realizada com cada um deles é apresentado na tabela a seguir, em que  respectivamente, as médias amostrais das variáveis x e y.


Com base nos dados dessa tabela, julgue o próximo item.


Pelo modelo de regressão linear simples, a equação que expressa o relacionamento ajustado entre a variável y em função de x é Imagem associada para resolução da questão em que α é uma constante.

Alternativas
Q1895657 Algoritmos e Estrutura de Dados

Uma árvore de decisão representa um determinado número de caminhos possíveis de decisão e os resultados de cada um deles, apresentando muitos pontos positivos, ou seja, são fáceis de entender e interpretar. Elas têm processo de previsão completamente transparente e lidam facilmente com diversos atributos numéricos, assim como atributos categóricos, podendo até mesmo classificar dados sem atributos definidos.

De acordo com os aspectos construtivos de uma árvore de decisão, julgue o item a seguir.



Se o processo adotado para a construção de árvores de decisão for determinístico, uma forma de obtenção de árvores aleatórias, que compõem as florestas aleatórias, pode ser realizada por meio do bootstrap dos dados, em que cada árvore é treinada com base no resultado de bootstrap_sample (inputs). 

Alternativas
Respostas
56: E
57: C
58: E
59: C
60: C