Questões de Concurso Público Petrobras 2022 para Ciência de Dados

Foram encontradas 23 questões

Q1895649 Engenharia de Software
As métricas de avaliação de desempenho de um modelo de aprendizado de máquina, que é um componente integrante de qualquer projeto de ciência de dados, destinam-se a estimar a precisão da generalização de um modelo sobre os dados futuros (não vistos ou fora da amostra). Dentre as métricas mais conhecidas, estão a matriz de confusão, precisão, recall, pontuação, especificidade e a curva de características operacionais do receptor (ROC).
Acerca das características específicas dessas métricas, julgue o próximo item. 

A matriz de confusão a seguir apresenta três rótulos de classe; os elementos diagonais representam o número de pontos para os quais o rótulo previsto é igual ao rotulo verdadeiro, enquanto qualquer coisa fora da diagonal teve um rótulo atribuído erroneamente pelo classificador. Quanto menores forem os valores diagonais da matriz de confusão, melhor o modelo adotado. 

Imagem associada para resolução da questão
Alternativas
Q1895650 Engenharia de Software

As métricas de avaliação de desempenho de um modelo de aprendizado de máquina, que é um componente integrante de qualquer projeto de ciência de dados, destinam-se a estimar a precisão da generalização de um modelo sobre os dados futuros (não vistos ou fora da amostra). Dentre as métricas mais conhecidas, estão a matriz de confusão, precisão, recall, pontuação, especificidade e a curva de características operacionais do receptor (ROC).

Acerca das características específicas dessas métricas, julgue o próximo item.


As curvas ROC a seguir mostram a taxa de especificidade (verdadeiros positivos) versus a taxa de sensibilidade (falsos positivos) do modelo adotado; a linha tracejada é a linha de base da métrica de avaliação e define uma adivinhação aleatória.  


Imagem associada para resolução da questão

 

Alternativas
Q1895651 Engenharia de Software

Imagem associada para resolução da questão


Julgue o próximo item, considerando o gráfico precedente, que representa as regiões de overfitting e de underfitting, permitindo uma avaliação do relacionamento da complexidade do modelo de aprendizagem de máquina adotado, com o erro de predição. 




A região do gráfico entre as duas curvas, indicada pela letra B, mostra a região de erro de generalização para o modelo de aprendizado de máquina. 

Alternativas
Q1895652 Engenharia de Software

Imagem associada para resolução da questão


Julgue o próximo item, considerando o gráfico precedente, que representa as regiões de overfitting e de underfitting, permitindo uma avaliação do relacionamento da complexidade do modelo de aprendizagem de máquina adotado, com o erro de predição. 



O Set de Treinamento é usado para qualificar o desempenho do modelo, enquanto o Set de Validação é utilizado para criar o modelo de aprendizado de máquina.

Alternativas
Q1895653 Engenharia de Software

Imagem associada para resolução da questão


Julgue o próximo item, considerando o gráfico precedente, que representa as regiões de overfitting e de underfitting, permitindo uma avaliação do relacionamento da complexidade do modelo de aprendizagem de máquina adotado, com o erro de predição. 



Considerando que a variância é um erro de sensibilidade para pequenas flutuações no conjunto de treinamento, infere-se que um baixo nível de variância pode fazer que o algoritmo associado a um modelo de aprendizado de máquina perca as relações relevantes entre os atributos de entrada e a variável de saída, caracterizando o erro de overfitting, percebido na região à direita do ponto A.

Alternativas
Q1895654 Engenharia de Software

Imagem associada para resolução da questão


Julgue o próximo item, considerando o gráfico precedente, que representa as regiões de overfitting e de underfitting, permitindo uma avaliação do relacionamento da complexidade do modelo de aprendizagem de máquina adotado, com o erro de predição. 



Quando se verifica um alto erro no treinamento com valor próximo ao erro na validação, percebido na região à esquerda do ponto A, tem-se um clássico problema de underfitting, caracterizado pelo alto valor do bias

Alternativas
Q1895659 Engenharia de Software

As máquinas de vetores de suporte (SVMs) são originalmente utilizadas para a classificação de dados em duas classes, ou seja, na geração de dicotomias. Nas SVMs com margens rígidas, conjuntos de treinamento linearmente separáveis podem ser classificados. Acerca das características das SVMs com margens rígidas, julgue o item a seguir. 



Um conjunto linearmente separável é composto por exemplos que podem ser separados por pelo menos um hiperplano. As SVMs lineares buscam o hiperplano ótimo segundo a teoria do aprendizado estatístico, definido como aquele em que a margem de separação entre as classes presentes nos dados é minimizada.

Alternativas
Q1895664 Engenharia de Software

Com respeito a análise de componentes principais, mistura de gaussianas e agrupamento k-means, julgue o item que se segue. 



Se a matriz de variância-covariância referente a três variáveis for

Imagem associada para resolução da questão

e se o menor autovalor dessa matriz for igual a 1,84, então as duas primeiras componentes principais explicam 81,6% da variação total referente a essas variáveis.  

Alternativas
Q1895666 Engenharia de Software

Com respeito a análise de componentes principais, mistura de gaussianas e agrupamento k-means, julgue o item que se segue. 



Considere a tabela abaixo que mostra as distâncias entre cada observação de um conjunto de dados hipotético e os vetores médios (centroides) do cluster correspondente ao final da aplicação do algoritmo de agrupamento k-means. Com base nessa tabela, infere-se que o cluster 1 é constituído pelas observações 2, 5 e 10. 

Imagem associada para resolução da questão

Alternativas
Q1895667 Engenharia de Software

Julgue o próximo item, relativos a redes neurais artificiais (RNA).


Uma RNA é formada por unidades que fazem operações a partir das entradas (sinais) recebidas pelas suas conexões; cada sinal é multiplicado por um peso e, após a soma ponderada dos sinais, caso o nível de atividade atinja o threshold, a unidade produz uma determinada resposta de saída.

Alternativas
Q1895668 Engenharia de Software

Julgue o próximo item, relativos a redes neurais artificiais (RNA).



Em RNA formada unicamente de perceptron, uma pequena alteração nos pesos de um único perceptron na rede pode ocasionar grandes mudanças na saída desse perceptron; mesmo com a inserção das funções de ativação, não é possível controlar o nível da mudança, por isso, essas redes são voltadas para a resolução de problemas específicos, tais como regressão e previsão de séries temporais.  

Alternativas
Q1895669 Engenharia de Software

Julgue o próximo item, relativos a redes neurais artificiais (RNA).


As funções de ativação são elementos importantes nas redes neurais artificiais; essas funções introduzem componente não linear nas redes neurais, fazendo que elas possam aprender mais do que relações lineares entre as variáveis dependentes e independentes, tornando-as capazes de modelar também relações não lineares. 

Alternativas
Q1895670 Engenharia de Software

Julgue o próximo item, relativos a redes neurais artificiais (RNA).


O algoritmo de backpropagation consiste das fases de propagação e de retro propagação: na primeira, as entradas são passadas através da rede e as previsões de saída são obtidas; na segunda, se calcula o termo de correção dos pesos e, por conseguinte, a atualização dos pesos.

Alternativas
Q1895671 Engenharia de Software

Julgue o próximo item, relativos a redes neurais artificiais (RNA).


Rede neural recorrente é uma arquitetura similar à feedforward; a diferença é que a cada nova camada oculta (hidden layer) é acrescentada outra camada recorrente à arquitetura conectada à camada anterior, duplicando assim a quantidade de camadas. 

Alternativas
Q1895672 Engenharia de Software

Julgue o próximo item, relativos a redes neurais artificiais (RNA).



Em RNA, o uso de early stopping, ainda que não evite o overfitting, permite calcular com mais precisão a classificação nos dados de validação e, assim, melhorar a acurácia do treinamento. 

Alternativas
Q1895673 Engenharia de Software

Julgue o próximo item, relativos a redes neurais artificiais (RNA).


As redes neurais convolucionais se utilizam de uma arquitetura especial que é adaptada para classificar imagens por meio de algoritmo de aprendizado profundo que pode captar uma imagem de entrada, atribuir importância por meio de pesos e ser capaz de diferenciar um do outro.

Alternativas
Q1895674 Engenharia de Software

Julgue o próximo item, relativos a redes neurais artificiais (RNA).


Uma rede neural convolucional é composta por camadas convolucionais, unidades de processamento não linear e camadas de subamostragem (pooling); ela possui como característica a habilidade em explorar correlações temporais e espaciais nos dados. 

Alternativas
Q1895676 Engenharia de Software

Com respeito a machine learning aplicado, julgue o próximo item.


Classificação de imagens é um método de aprendizado não supervisionado no qual se aplica um modelo de treinamento para o reconhecimento de padrões gráficos presentes em amostras de imagens. 

Alternativas
Q1895677 Engenharia de Software

Com respeito a machine learning aplicado, julgue o próximo item.


Mask RCNN (region-based convolutional neural network) é um método para segmentação de objetos e instâncias que se baseia em detecção, enquanto o método SSAP (single-shot instance segmentation) se baseia em pixels.  

Alternativas
Q1895678 Engenharia de Software

Com respeito a machine learning aplicado, julgue o próximo item.


Stop-words constituem um conjunto de palavras que proporcionam pouca informação para o significado de uma frase. 

Alternativas
Respostas
1: E
2: E
3: C
4: E
5: E
6: C
7: E
8: C
9: E
10: C
11: E
12: C
13: C
14: E
15: E
16: C
17: C
18: C
19: C
20: C