Questões de Concurso Para epe

Foram encontradas 2.430 questões

Resolva questões gratuitamente!

Junte-se a mais de 4 milhões de concurseiros!

Q2847413 Algoritmos e Estrutura de Dados
A análise de componentes principais (Principal Component Analysis - PCA) é uma técnica consagrada para a redução de dimensionalidade e para a identificação de padrões estruturais lineares em conjuntos de dados.

Com relação à análise de componentes principais, analise as afirmativas a seguir e assinale (V) para a verdadeiras e (F) para a falsa.


( ) Baseia-se na identificação dos autovetores da matriz de covariâncias dos dados, permitindo ao analista determinar direções de maiores variações nas instâncias de dados.

( ) Permite a seleção e a eliminação das dimensões referentes às direções de maiores variações nas instâncias de dados, que por sua vez contribuem com poucas informações úteis para a análise do conjunto de dados.

( ) É utilizada em compressão de dados, pois permite a representação dos dados em menos dimensões que são facilmente interpretáveis pelo analista, sem grandes perdas de informações.


As afirmativas são, respectivamente.
Alternativas
Q2847411 Algoritmos e Estrutura de Dados
As técnicas de aprendizado supervisionado estão baseadas na determinação de modelos capazes de otimizar o mapeamento entre entradas e saídas de um conjunto de dados. Por vezes, o processo de treinamento pode gerar modelos muito complexos que “aprendem” o ruído existente nos conjuntos de dados, caracterizando o fenômeno de sobreajuste ou overfitting.

Um método que pode ajudar a mitigar a ocorrência do overfitting consiste em

I. dividir o conjunto de dados em k partes;
II. utilizar uma das partes para teste e as outras k-1 para treinamento;
III. repetir o processo para cada uma das k partes do conjunto de dados; e
IV. avaliar a média das métricas de performance para o modelo.

O método acima é chamado de
Alternativas
Q2847410 Programação
O pacote dplyr do R é um dos mais usados para manipulação de dados.
Assinale a opção que indica o conjunto de funções auxiliares desse pacote que são muito úteis para a seleção de colunas. 
Alternativas
Q2847409 Programação
Na Ciência de Dados é muito comum a utilização da linguagem Python e do R para visualização de dados.

Sobre as diferenças entre essas duas ferramentas, analise as afirmativas a seguir.


I. Python possui um padrão mais bem definido, permitindo que diferentes tipos de funcionalidades sejam escritos da mesma forma, enquanto no R, a mesma funcionalidade pode ser escrita de diversas formas diferentes.

II. Python é principalmente usada quando a análise de dados precisa ser integrada com aplicativos web ou se o código estatístico precisa ser integrado em um servidor em ambiente de produção, que vai servir muitos usuários, enquanto o R é principalmente usado quando as atividades de análise de dados requerem computação standalone (em um único computador) ou análise em servidores individuais.

III. Tanto o Python quanto o R foram criados inicialmente para análise de dados.


Está correto o que se afirma em
Alternativas
Q2847408 Programação
Um analista da área de ciência de dados construiu um histograma levando em consideração uma determinada base de dados. Para incluir uma curva nesse histograma foi utilizado a função as.timeSeries.

Essa função pertence à biblioteca
Alternativas
Respostas
146: E
147: C
148: B
149: B
150: C