Questões de Concurso para Engenheiro de Processamento Digital

Q1949150

Ano: 2022 Banca: FUNDATEC Órgão: AGERGS Prova: FUNDATEC - 2022 - AGERGS - Técnico Superior Engenheiro de Dados |

Q1949150 Engenharia de Software

Sobre os termos das características de processo de processamento de texto NLP, analise as assertivas abaixo e assinale a alternativa correta.

I. Stopwords.
II. Tf-id+f (Term Frequency-inverse document frequency).
III. Word embedding.
IV. Word2vec.

A

Todas estão corretas.

B

Todas estão incorretas.

C

Apenas I está correta.

D

Apenas I e II estão corretas.

E

Apenas III e IV estão corretas.

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q1949149

Ano: 2022 Banca: FUNDATEC Órgão: AGERGS Prova: FUNDATEC - 2022 - AGERGS - Técnico Superior Engenheiro de Dados |

Q1949149 Engenharia de Software

Sobre NLP, é INCORRETO afirmar que:

A

NLP trata a possibilidade de humanos se comunicarem com máquinas da forma mais natural possível, sem ser preciso aprender línguas artificiais muito específicas, que são os comandos nos quais manipula-se um computador.

B

Linguagem natural destina-se à comunicação dos seres humanos sobre o mundo, sendo que a maior parte da comunicação linguística ocorre através da fala. A linguagem escrita ainda é muito recente se comparado à fala, e para um computador, mais fácil de ser interpretada.

C

NLP pode ser entendido como aplicações computacionais que compreendem linguagens naturais (compreensão e geração de textos), tanto na fonética quando na escrita, sendo que a última é mais fácil de um computador conseguir interpretar de maneira correta, pois não tem que lidar com problemas do sinal do áudio, como o ruído por exemplo.

D

É possível através da NLP interpretar na língua portuguesa a interpretação.

E

NLP é uma área dentro da Inteligência Artificial.

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q1949148

Ano: 2022 Banca: FUNDATEC Órgão: AGERGS Prova: FUNDATEC - 2022 - AGERGS - Técnico Superior Engenheiro de Dados |

Q1949148 Sistemas Operacionais

Sobre Apache Spark, analise as assertivas abaixo e assinale a alternativa correta.
I. Similar a linguagem SQL, Spark SQLfunciona de maneira similar ao Hive, que converte códigos SQL para Map Reduce Java.
II. Spark Streaming é uma extensão do Spark, voltada para processamento de dados em tempo real, apresentando diversas propriedades interessantes, entre elas, podemos destacar a escalabilidade e a tolerância a falhas, processamento único e a possível integração entre processos batch e em tempo real.
III. O MLLib consiste em uma biblioteca de códigos de machine learning prontos e disponíveis para uso, funcionando de forma muito parecida aos pacotes do R ou ao numpy e ao scikit-learn do python.
IV. O GraphX, foi desenvolvido com o intuito de substituir os sistemas especializados de grafos que foram feitos para Hadoop, permitindo a análise e processamento de grafos em paralelo.

A

Todas estão corretas.

B

Todas estão incorretas.

C

Apenas I está correta.

D

Apenas I e II estão corretas.

E

Apenas III e IV estão corretas.

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q1949147

Ano: 2022 Banca: FUNDATEC Órgão: AGERGS Prova: FUNDATEC - 2022 - AGERGS - Técnico Superior Engenheiro de Dados |

Q1949147 Programação

São exemplos de operações de transformação em Spark, EXCETO:

A

map (func) – retorna um novo RDD aplicando a função func em cada elemento.

B

filter (func) – retorna um novo RDD aplicando o filtro func.

C

flatMap (func) – similar ao map, mas retornando mais itens ao invés de apenas um.

D

Joinstep – responsável pelo relacionamento de objetos.

E

distinct() – retorna um novo dataset contendo os valores distintos do RDD original.

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q1949146

Ano: 2022 Banca: FUNDATEC Órgão: AGERGS Prova: FUNDATEC - 2022 - AGERGS - Técnico Superior Engenheiro de Dados |

Q1949146 Programação

A programação em Spark se baseia no conceito de RDD’s. Os RDD’s são a unidade fundamental de dados no Spark e têm como principal característica a propriedade de ser imutável. Sobre os RDD’s, é correto afirmar que:

A

Os RDD’s não podem ser particionados ou divididos no cluster.

B

As operações em RDD são divididas em 5 tipos, transformação, ação, segmentação, logarítmica e semântica.

C

As operações logarítmicas do RDD, são responsáveis pelas ações de classificação dos modelos desenvolvidos em SPARK.

D

RDD’s são algoritmos desenvolvidos em JAVA para o cálculo de espaço em disco para armazenamento das informações distribuídas em SPARK.

E

Os RDD’s podem armazenar qualquer tipo de elemento, como tipos primitivos (inteiros, caracteres, booleanos, etc.), sequências (strings, listas, arrays, tuples, etc.), assim como tipos mistos e objetos Scala ou Java.

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q1949145

Ano: 2022 Banca: FUNDATEC Órgão: AGERGS Prova: FUNDATEC - 2022 - AGERGS - Técnico Superior Engenheiro de Dados |

Q1949145 Sistemas Operacionais

Sobre Apache Spark, analise as assertivas abaixo e assinale a alternativa correta.
I. De forma geral, o Spark é uma engine rápida, escrita em Scala, para processamento de grandes volumes de dados em um cluster de computadores.
II. Scala é uma linguagem funcional que roda na JVM.
III. O Spark, assim como o Hadoop, também foi pensado para ser escalável.
IV. Umas das grandes vantagens do Spark em relação ao Hadoop são as High Level API’s de programação. Enquanto que o Hadoop é nativamente apenas Java, no Spark, temos a disposição API ’s em Scala, Java e Python.

A

Todas estão corretas.

B

Todas estão incorretas.

C

Apenas I está correta.

D

Apenas I e II estão corretas.

E

Apenas III e IV estão corretas.

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q1949144

Ano: 2022 Banca: FUNDATEC Órgão: AGERGS Prova: FUNDATEC - 2022 - AGERGS - Técnico Superior Engenheiro de Dados |

Q1949144 Engenharia de Software

A ideia principal da técnica de “dropout” é descartar aleatoriamente unidades da rede neural (junto com suas conexões) durante a etapa de treinamento. Sobre a técnica de “dropout”, assinale a alternativa INCORRETA.

A

O uso da técnica de “dropout” força a rede a construir uma representação distribuída e redundante.

B

O uso da técnica de “dropout” pode ser visto como equivalente a treinar uma grande coleção (ou “ensemble”) de modelos que compartilham parâmetros.

C

Para a realização de “dropout”, basta multiplicar-se as ativações por variáveis aleatórias de Bernoulli com uma dada probabilidade.

D

Durante a predição, todas as unidades são mantidas ativas, não sendo necessário se realizar nenhum outro ajuste das ativações.

E

Ao contrário de regularização L1 e L2, o dropout não depende da modificação da função de custo.

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q1949143

Ano: 2022 Banca: FUNDATEC Órgão: AGERGS Prova: FUNDATEC - 2022 - AGERGS - Técnico Superior Engenheiro de Dados |

Q1949143 Banco de Dados

Uma função de perda mede a diferença entre uma predição do valor alvo e o valor disponível no conjunto de treinamento. Sobre o assunto, assinale a alternativa INCORRETA.

A

A função de perda permite que se busque por um modelo que minimize o risco empírico.

B

O uso de uma função de perda garante a minimização do risco.

C

Existem inúmeras funções de perda e, portanto, deve-se selecionar a mais adequada para se avaliar a proximidade entre predição e alvo esperado.

D

O uso de uma função de perda é uma alternativa interessante para se avaliar a proximidade entre predição e alvo esperado.

E

Uma função de perda mapeia um evento ou valores de uma ou mais variáveis.

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q1949142

Ano: 2022 Banca: FUNDATEC Órgão: AGERGS Prova: FUNDATEC - 2022 - AGERGS - Técnico Superior Engenheiro de Dados |

Q1949142 Engenharia de Software

Recentemente, encontram-se muitas referências na literatura e na mídia em geral ao uso de aprendizagem profunda (ou “deep learning”). Sobre o assunto, assinale a alternativa INCORRETA.

A

Na aprendizagem profunda, conceitos complexos (de níveis mais altos ou abstratos) são definidos em termos de sua relação com conceitos mais simples (em níveis mais baixos).

B

A aprendizagem profunda não apresenta nenhuma relação com o aprendizado de máquina, podendo ser vista como uma abordagem alternativa para tarefas em que o aprendizado de máquina não consegue obter bons resultados.

C

A aprendizagem profunda pode ser entendida como um tipo de aprendizagem de representação em que características mais abstratas são inferidas a partir de características mais simples.

D

Uma das razões determinantes para o recente sucesso da aprendizagem profunda se encontra na maior disponibilidade de grandes conjuntos de dados para as mais diversas tarefas.

E

Deep Learning é um ramo de aprendizado de máquina.

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q1949141

Ano: 2022 Banca: FUNDATEC Órgão: AGERGS Prova: FUNDATEC - 2022 - AGERGS - Técnico Superior Engenheiro de Dados |

Q1949141 Banco de Dados

Sobre BIG Data, analise as assertivas abaixo e assinale a alternativa correta.
I. Hadoop e Elasticsearch são exemplos de tecnologias que permitem a computação em nuvem.
II. BIG Data é o termo em tecnologia da informação que tem a capacidade de trabalhar com grandes conjuntos de dados.
III. O Conceito de BIG DATA pode ser subdividido em 5 categorias ou “5 v’s”, VOLUME, VALOR, VELOCIDADE, VERACIDADE e VARIEDADE.
IV. Um dos maiores desafios em trabalhar com soluções de BIG DATA é o volume dos dados.

A

Todas estão corretas.

B

Todas estão incorretas.

C

Apenas I está correta.

D

Apenas I e II estão corretas.

E

Apenas III e IV estão corretas.

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q1949140

Ano: 2022 Banca: FUNDATEC Órgão: AGERGS Prova: FUNDATEC - 2022 - AGERGS - Técnico Superior Engenheiro de Dados |

Q1949140 Programação

Uma das características da linguagem HIVEQL é ter uma extensão que permita distribuir consultas entre reducers em um script do tipo map-reduce. Qual extensão deve-se usar para distribuir as consultas e garantir a ordenação ou o agrupamento das chaves distribuídas?

A

DISTRIBUTE BY

B

CLUSTER BY

C

GROUP BY

D

REDUCE BY

E

USING

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q1949139

Ano: 2022 Banca: FUNDATEC Órgão: AGERGS Prova: FUNDATEC - 2022 - AGERGS - Técnico Superior Engenheiro de Dados |

Q1949139 Banco de Dados

Sobre os tipos de banco de dados NOSQL, analise as assertivas abaixo:

I. Colunar.

II. Grafos.

III. Chave-valor.

IV. Documento.

Quais estão corretas?

A

Apenas II.

B

Apenas III.

C

Apenas I, II e III.

D

Apenas II, III e IV.

E

I, II, III e IV.

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q1949138

Ano: 2022 Banca: FUNDATEC Órgão: AGERGS Prova: FUNDATEC - 2022 - AGERGS - Técnico Superior Engenheiro de Dados |

Q1949138 Banco de Dados

Classificado como um programa de banco de dados NoSQL, o MongoDB é um banco de dados de código aberto e de alta performance, que se caracteriza por não possuir esquemas, ser escrito em C++, ser multiplataforma e ser formado por um conjunto de aplicativos JSON. O MongoDB é um banco de dados NoSQL:

A

Orientado a colunas, semelhante ao banco de dados BigTable do Google.

B

Orientado a documentos, com estruturas flexíveis que podem ser obtidas por meio de dados semiestruturados, como o formato XML e JSON.

C

Orientado a objetos e possui conceitos similares ao do modelo relacional, como a criação de linhas e colunas.

D

Do tipo chave-valor, que usa uma tabela hash na qual há uma chave única e um indicador de um dado ou de um item em particular.

E

Orientado a grafos, semelhante ao banco de dados Neo4J.

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q1949137

Ano: 2022 Banca: FUNDATEC Órgão: AGERGS Prova: FUNDATEC - 2022 - AGERGS - Técnico Superior Engenheiro de Dados |

Q1949137 Banco de Dados

MongoDB é um banco de dados não relacional. Esses bancos de dados também são chamados de NOSQL. Permitem controlar com precisão os dados armazenados globalmente, para garantir desempenho rápido em qualquer lugar. Um desenvolvedor está trabalhando com o modelo deste banco de dados não relacional, e encontra-se com o prompt de comando do Windows aberto como administrador, localizado na pasta c:\mongo\bin, o comando: mongod --dbpath D:\BD\Data\ é executado na linha de comando. Considerando as informações acima, a execução deste comando é realizada para:

A

Executar o Mongo Cliente para executar as queries na coleção data.

B

Executar o servidor do Mongo, pois, no processo de instalação, o caminho não foi configurado nas variáveis de ambiente do Windows.

C

Criar os arquivos de log e executar o Mongo cliente na pasta BD/Data.

D

Executar o Mongo e criar o banco de dados através do comando mongod.

E

Criar documentos em JSON, utilizando a estrutura Binary JSON.

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q1949136

Ano: 2022 Banca: FUNDATEC Órgão: AGERGS Prova: FUNDATEC - 2022 - AGERGS - Técnico Superior Engenheiro de Dados |

Q1949136 Banco de Dados

Podemos afirmar que uma tabela factless é:

A

São tabelas fato comuns, com métricas a atributos que referenciam determinadas dimensões.

B

As tabelas de fato sem fato são encontradas na modelagem de um data warehouse, elas não possuem nenhuma medida e contém apenas chaves estrangeiras para as dimensões.

C

São tabelas snapshots, que acumulam e descrevem as atividades de negócio do início ao fim.

D

Tabela Factless são conhecidas como aggregate table, armazenam e pré-calculam as informações, são alimentadas por uma tabela intermediária.

E

São tabelas excluídas de um modelo multidimensional e armazenada como backup em uma stagin área.

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q1949135

Ano: 2022 Banca: FUNDATEC Órgão: AGERGS Prova: FUNDATEC - 2022 - AGERGS - Técnico Superior Engenheiro de Dados |

Q1949135 Banco de Dados

Sobre granularidade de um modelo dimensional, assinale a alternativa correta.

A

Grão é o menor nível de informação e é definido de acordo com as necessidades do modelo de dados.

B

Grão é o nome dados a uma tabela de um modelo Starschema.

C

Grão é considerado um prefixo de nomenclatura de tabela de banco de dados na construção de um modelo dimensional.

D

Grão é a sumarização dos caracteres de um resultado de uma consulta de select no banco de dados PostgreSQL.

E

O Grão de uma tabela é a soma de todas as colunas de um banco de dados.

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q1949134

Ano: 2022 Banca: FUNDATEC Órgão: AGERGS Prova: FUNDATEC - 2022 - AGERGS - Técnico Superior Engenheiro de Dados |

Q1949134 Banco de Dados

Sobre os métodos que podemos considerar em um processo de construção de um Data Warehouse, analise as assertivas abaixo:

I. Star Schema.
II. Bifurcação entre tabelas.
III. Snowflake.
IV. Fullflake.
V. Dimension Only.

Quais estão corretas?

A

Apenas I.

B

Apenas V.

C

Apenas I e III.

D

Apenas II, III e IV.

E

I, II, III, IV e V.

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q1949133

Ano: 2022 Banca: FUNDATEC Órgão: AGERGS Prova: FUNDATEC - 2022 - AGERGS - Técnico Superior Engenheiro de Dados |

Q1949133 Banco de Dados

No processo de ETL, qual é o nome dados para a área intermediária criada, antes de serem processados?

A

cubo OLAP.

B

dicionário de dados.

C

staging.

D

data vault.

E

data mart.

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q1949132

Ano: 2022 Banca: FUNDATEC Órgão: AGERGS Prova: FUNDATEC - 2022 - AGERGS - Técnico Superior Engenheiro de Dados |

Q1949132 Banco de Dados

Sobre o Fluxo de eficiente de um processo de ETL executar funções, analise as assertivas abaixo e assinale a alternativa correta.

I. Extração de Dados de Fontes Diversas.
II. Transformação de dados.
III. Cargas dos dados.
IV. Multiplicação das informações.

A

Todas estão corretas.

B

Todas estão incorretas.

C

Apenas I e II estão corretas.

D

Apenas III e IV estão corretas.

E

Apenas I, II e III estão corretas.

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q1949131

Ano: 2022 Banca: FUNDATEC Órgão: AGERGS Prova: FUNDATEC - 2022 - AGERGS - Técnico Superior Engenheiro de Dados |

Q1949131 Banco de Dados

MDM (Master Data Management) é responsável por:

A

Misturar os dados para criar um panorama virtual.

B

Monitorar e processar fluxos de dados e ajudar a tomar decisões mais rapidamente.

C

Fornecer tanto agendamento em lote quanto capacidades em tempo real.

D

Unir os dados para criar uma visão única deles, através de múltiplas fontes. Ela inclui tanto o etl quanto capacidades de data integration, para misturar as informações e criar o “melhor registro”.

E

Criar um ambiente de testes onde os dados possam ser integrados, limpos e padronizados.

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

SEJA VITALÍCIO

SEJA VITALÍCIO

Questões de Concurso Para engenheiro de processamento digital

Foram encontradas 70 questões

Resolva questões gratuitamente!

, continue estudando de graça!