Questões de Concurso Público AGERGS 2022 para Técnico Superior Engenheiro de Dados

Foram encontradas 70 questões

Q1949141 Banco de Dados
Sobre BIG Data, analise as assertivas abaixo e assinale a alternativa correta.
I. Hadoop e Elasticsearch são exemplos de tecnologias que permitem a computação em nuvem.
II. BIG Data é o termo em tecnologia da informação que tem a capacidade de trabalhar com grandes conjuntos de dados.
III. O Conceito de BIG DATA pode ser subdividido em 5 categorias ou “5 v’s”, VOLUME, VALOR, VELOCIDADE, VERACIDADE e VARIEDADE.
IV. Um dos maiores desafios em trabalhar com soluções de BIG DATA é o volume dos dados.
Alternativas
Q1949142 Engenharia de Software
Recentemente, encontram-se muitas referências na literatura e na mídia em geral ao uso de aprendizagem profunda (ou “deep learning”). Sobre o assunto, assinale a alternativa INCORRETA. 
Alternativas
Q1949143 Banco de Dados
Uma função de perda mede a diferença entre uma predição do valor alvo e o valor disponível no conjunto de treinamento. Sobre o assunto, assinale a alternativa INCORRETA.
Alternativas
Q1949144 Engenharia de Software
A ideia principal da técnica de “dropout” é descartar aleatoriamente unidades da rede neural (junto com suas conexões) durante a etapa de treinamento. Sobre a técnica de “dropout”, assinale a alternativa INCORRETA.
Alternativas
Q1949145 Sistemas Operacionais
Sobre Apache Spark, analise as assertivas abaixo e assinale a alternativa correta.
I. De forma geral, o Spark é uma engine rápida, escrita em Scala, para processamento de grandes volumes de dados em um cluster de computadores.
II. Scala é uma linguagem funcional que roda na JVM.
III. O Spark, assim como o Hadoop, também foi pensado para ser escalável.
IV. Umas das grandes vantagens do Spark em relação ao Hadoop são as High Level API’s de programação. Enquanto que o Hadoop é nativamente apenas Java, no Spark, temos a disposição API ’s em Scala, Java e Python.
Alternativas
Q1949146 Programação
A programação em Spark se baseia no conceito de RDD’s. Os RDD’s são a unidade fundamental de dados no Spark e têm como principal característica a propriedade de ser imutável. Sobre os RDD’s, é correto afirmar que:
Alternativas
Q1949147 Programação
São exemplos de operações de transformação em Spark, EXCETO:
Alternativas
Q1949148 Sistemas Operacionais
Sobre Apache Spark, analise as assertivas abaixo e assinale a alternativa correta.
I. Similar a linguagem SQL, Spark SQLfunciona de maneira similar ao Hive, que converte códigos SQL para Map Reduce Java.
II. Spark Streaming é uma extensão do Spark, voltada para processamento de dados em tempo real, apresentando diversas propriedades interessantes, entre elas, podemos destacar a escalabilidade e a tolerância a falhas, processamento único e a possível integração entre processos batch e em tempo real.
III. O MLLib consiste em uma biblioteca de códigos de machine learning prontos e disponíveis para uso, funcionando de forma muito parecida aos pacotes do R ou ao numpy e ao scikit-learn do python.
IV. O GraphX, foi desenvolvido com o intuito de substituir os sistemas especializados de grafos que foram feitos para Hadoop, permitindo a análise e processamento de grafos em paralelo.
Alternativas
Q1949149 Engenharia de Software
Sobre NLP, é INCORRETO afirmar que: 
Alternativas
Q1949150 Engenharia de Software
Sobre os termos das características de processo de processamento de texto NLP, analise as assertivas abaixo e assinale a alternativa correta.

I. Stopwords.
II. Tf-id+f (Term Frequency-inverse document frequency).
III. Word embedding.
IV. Word2vec. 
Alternativas
Respostas
31: A
32: B
33: B
34: D
35: A
36: E
37: D
38: A
39: D
40: A