Questões de Concurso Para analista (superior)

Foram encontradas 24.535 questões

Resolva questões gratuitamente!

Junte-se a mais de 4 milhões de concurseiros!

Q2517660 Programação
Durante a preparação de dados para análise, alterar a quantidade de dimensões e/ou elementos de cada dimensão de um dado do tipo Array é uma operação importante na manipulação de dados. Observe o seguinte trecho de código escrito na linguagem de programação Python:

import numpy as np arr = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12]) newarr = arr.reshape(2, 3, 2) print(newarr)

O resultado da execução do código apresentado é:
Alternativas
Q2517659 Programação
Uma das principais atividades de implementação de um ambiente analítico é a limpeza dos conjuntos de dados origem. A biblioteca Pandas do Python é utilizada para analisar e também para limpar conjuntos de dados. Observe o trecho de código Python a seguir, que utiliza a biblioteca Pandas.

import pandas as pd df = pd.read_csv('data.csv') df.dropna(inplace = True)

O resultado da execução do código apresentado é a alteração do conjunto original de dados com o(a):
Alternativas
Q2517658 Banco de Dados
As demandas de dados pelos analistas e cientistas de dados da CVM estão aumentando a cada dia. Para atendê-las com agilidade, é necessário obter dados de diversas fontes heterogêneas no seu formato original para posterior seleção e processamento sob demanda.

Para armazenar dados estruturados, não estruturados e semiestruturados, deve-se implementar um(a):
Alternativas
Q2517657 Banco de Dados
O dado no formato JSON – padrão utilizado para armazenar e transportar dados – deve ser de algum tipo.
O dado que representa o tipo de dado JSON Array é o:
Alternativas
Q2517656 Banco de Dados
O ambiente analítico da CVM armazena dados no formato multidimensional, implementa um cubo de dados e disponibiliza uma ferramenta OLAP para apoiar os analistas no desempenho de suas funções. Diante da grande quantidade de dados disponíveis, eles precisam reduzir o seu domínio de análise.

Para isso, a operação OLAP, que extrai um subcubo da seleção de duas ou mais dimensões de um cubo de dados, é a:
Alternativas
Q2517655 Banco de Dados
As transações financeiras da CVM são realizadas sobre ativos nacionais, utilizando a moeda real (R$), e ativos internacionais, utilizando a moeda dólar americano (US$).

Para implementar um Data Mart Financeiro da CVM, permitindo análises dos ativos nas duas moedas, deve-se:
Alternativas
Q2517654 Banco de Dados
Para apoiar análises sobre os fundadores de empresas ao longo do tempo, elaborou-se, inicialmente, o seguinte modelo multidimensional de dados, no qual a tabela FATO FUNDAÇÃO EMPRESAS se relaciona com múltiplos valores da tabela DIMENSÃO FUNDADOR.

Imagem associada para resolução da questão


No caso apresentado, a implementação de uma dimensão multivalorada deve ser realizada por meio da aplicação da técnica de modelagem multidimensional: 
Alternativas
Q2517653 Banco de Dados
O analista Gabriel fez um levantamento das bases de dados existentes na CVM e percebeu que havia Data Marts distintos, criados para atender a requisitos analíticos específicos de cada Superintendência, como: Relações Institucionais, Auditoria e Registro de Valores Imobiliários. Cada Data Mart foi construído de forma independente, o que dificultava análises integradas para relacionar dados das diferentes Superintendências. Gabriel observou que havia várias dimensões em comum nos Data Marts. Para permitir análises integradas padronizando e compartilhando as dimensões em comum dos Data Marts da CVM, Gabriel implementou um(a):
Alternativas
Q2517652 Banco de Dados
Janine é a responsável pela administração dos bancos de dados gerenciados pelo PostgreSQL de uma autarquia federal. Durante a criação de um banco de dados, Janine especificou a criação de um tablespace diferente do tablespace default.

O tablespace criado por Janine: 
Alternativas
Q2517651 Banco de Dados
Diante de várias reclamações de performance em resposta a consultas a dados por meio de um dos sistemas estruturantes de uma autarquia federal, a equipe de tecnologia identificou que o motivo estava na lentidão para recuperação de registros na base de dados utilizada pelo sistema. Para agilizar a recuperação de registros em resposta a uma pesquisa que utiliza um campo que comporta valores repetidos, a equipe de tecnologia criou índices.
Considerando que já existe um índice primário para o conjunto de dados em questão, a equipe criou um índice:
Alternativas
Q2517650 Banco de Dados
Os Sistemas Gerenciadores de Banco de Dados (SGBD) comerciais implementam internamente técnicas para processar, otimizar e executar consultas de alto nível.

Uma estratégia eficiente utilizada pelo otimizador de consultas do SGBD considera o uso de:
Alternativas
Q2517649 Banco de Dados
As transações em banco de dados possuem propriedades que buscam proteger dados contra perdas ou danos.
A propriedade durabilidade tem relação com:
Alternativas
Q2517648 Banco de Dados
O modelo relacional representa o banco de dados como uma coleção de relações. Considere a relação COLABORADOR apresentada a seguir, cuja chave primária é Matricula.

Imagem associada para resolução da questão


Na relação COLABORADOR, o(a):
Alternativas
Q2517647 Banco de Dados

Observe o Modelo de Entidades e Relacionamentos a seguir.



Imagem associada para resolução da questão


Com base nos relacionamentos apresentados, está explícito que:

Alternativas
Q2517646 Banco de Dados
Documentos do Jupyter Notebook são salvos com a extensão .ipynb, mas internamente eles são documentos do tipo:
Alternativas
Q2517645 Programação
Igor, analista de dados da CVM, escreveu e rodou o código a seguir.

from nltk.corpus import stopwords from nltk.tokenize import word_tokenize
texto = "Eu sou um analista de dados da CVM!"
stop_words = set(stopwords.words('portuguese')) tokens = word_tokenize(texto)
tokens_processados = [w for w in tokens if not w in stop_words]
print(tokens_processados)

Considerando que o código foi executado sem erros e sabendo que Igor está usando Python 3.10.12 e NLTK 3.8.1, a saída do terminal foi:
Alternativas
Q2517644 Programação
Um cientista de dados utiliza a biblioteca scikit-learn para treinar um estimador clf usando um conjunto de treinamento X1 e seu respectivo conjunto de atributos-alvo y. Posteriormente, o cientista estima os atributos-alvo do conjunto X2.

Para realizar o treinamento e a predição, o cientista de dados deve usar, respectivamente, os métodos:
Alternativas
Q2517643 Engenharia de Software
No método tensorflow.keras.layers.Dense(...), se nenhuma função de ativação é especificada, é utilizada por padrão a função:
Alternativas
Q2517642 Programação

Considere o código python a seguir.


import spacy


nlp = spacy.load("pt_core_news_lg")

doc = nlp("O rato roeu a roupa do rei de Roma")


print(doc[2].pos_, doc[2].dep_)


Os valores exibidos pela última linha são:

Alternativas
Q2517641 Banco de Dados
Uma certa organização gostaria de compartilhar dados com um grupo de pesquisadores de uma universidade para a condução de um estudo sobre problemas ergonômicos nos seus escritórios. Entre os dados coletados, há informações sensíveis sobre seus funcionários; portanto, o responsável pela coleta decidiu anonimizar os dados. Isso foi feito removendo-se nomes e outros campos identificadores e adicionando-se um número identificador próprio a cada funcionário. Dessa forma, a identidade dos funcionários seria preservada. Após a verificação de uma amostra, o pesquisador responsável pelo estudo recomendou medidas que deveriam ser aplicadas antes que os dados pudessem ser aceitos para o estudo.

O problema que mais provavelmente motivou a recomendação do pesquisador e uma medida que pode mitigar esse problema são, respectivamente:
Alternativas
Respostas
6061: C
6062: D
6063: B
6064: D
6065: B
6066: A
6067: A
6068: E
6069: E
6070: E
6071: C
6072: C
6073: D
6074: A
6075: C
6076: D
6077: B
6078: A
6079: B
6080: C