Questões de Concurso Para tecnologia da informação

Foram encontradas 166.739 questões

Resolva questões gratuitamente!

Junte-se a mais de 4 milhões de concurseiros!

Q2517652 Banco de Dados
Janine é a responsável pela administração dos bancos de dados gerenciados pelo PostgreSQL de uma autarquia federal. Durante a criação de um banco de dados, Janine especificou a criação de um tablespace diferente do tablespace default.

O tablespace criado por Janine: 
Alternativas
Q2517651 Banco de Dados
Diante de várias reclamações de performance em resposta a consultas a dados por meio de um dos sistemas estruturantes de uma autarquia federal, a equipe de tecnologia identificou que o motivo estava na lentidão para recuperação de registros na base de dados utilizada pelo sistema. Para agilizar a recuperação de registros em resposta a uma pesquisa que utiliza um campo que comporta valores repetidos, a equipe de tecnologia criou índices.
Considerando que já existe um índice primário para o conjunto de dados em questão, a equipe criou um índice:
Alternativas
Q2517650 Banco de Dados
Os Sistemas Gerenciadores de Banco de Dados (SGBD) comerciais implementam internamente técnicas para processar, otimizar e executar consultas de alto nível.

Uma estratégia eficiente utilizada pelo otimizador de consultas do SGBD considera o uso de:
Alternativas
Q2517649 Banco de Dados
As transações em banco de dados possuem propriedades que buscam proteger dados contra perdas ou danos.
A propriedade durabilidade tem relação com:
Alternativas
Q2517648 Banco de Dados
O modelo relacional representa o banco de dados como uma coleção de relações. Considere a relação COLABORADOR apresentada a seguir, cuja chave primária é Matricula.

Imagem associada para resolução da questão


Na relação COLABORADOR, o(a):
Alternativas
Q2517647 Banco de Dados

Observe o Modelo de Entidades e Relacionamentos a seguir.



Imagem associada para resolução da questão


Com base nos relacionamentos apresentados, está explícito que:

Alternativas
Q2517646 Banco de Dados
Documentos do Jupyter Notebook são salvos com a extensão .ipynb, mas internamente eles são documentos do tipo:
Alternativas
Q2517645 Programação
Igor, analista de dados da CVM, escreveu e rodou o código a seguir.

from nltk.corpus import stopwords from nltk.tokenize import word_tokenize
texto = "Eu sou um analista de dados da CVM!"
stop_words = set(stopwords.words('portuguese')) tokens = word_tokenize(texto)
tokens_processados = [w for w in tokens if not w in stop_words]
print(tokens_processados)

Considerando que o código foi executado sem erros e sabendo que Igor está usando Python 3.10.12 e NLTK 3.8.1, a saída do terminal foi:
Alternativas
Q2517644 Programação
Um cientista de dados utiliza a biblioteca scikit-learn para treinar um estimador clf usando um conjunto de treinamento X1 e seu respectivo conjunto de atributos-alvo y. Posteriormente, o cientista estima os atributos-alvo do conjunto X2.

Para realizar o treinamento e a predição, o cientista de dados deve usar, respectivamente, os métodos:
Alternativas
Q2517643 Engenharia de Software
No método tensorflow.keras.layers.Dense(...), se nenhuma função de ativação é especificada, é utilizada por padrão a função:
Alternativas
Q2517642 Programação

Considere o código python a seguir.


import spacy


nlp = spacy.load("pt_core_news_lg")

doc = nlp("O rato roeu a roupa do rei de Roma")


print(doc[2].pos_, doc[2].dep_)


Os valores exibidos pela última linha são:

Alternativas
Q2517641 Banco de Dados
Uma certa organização gostaria de compartilhar dados com um grupo de pesquisadores de uma universidade para a condução de um estudo sobre problemas ergonômicos nos seus escritórios. Entre os dados coletados, há informações sensíveis sobre seus funcionários; portanto, o responsável pela coleta decidiu anonimizar os dados. Isso foi feito removendo-se nomes e outros campos identificadores e adicionando-se um número identificador próprio a cada funcionário. Dessa forma, a identidade dos funcionários seria preservada. Após a verificação de uma amostra, o pesquisador responsável pelo estudo recomendou medidas que deveriam ser aplicadas antes que os dados pudessem ser aceitos para o estudo.

O problema que mais provavelmente motivou a recomendação do pesquisador e uma medida que pode mitigar esse problema são, respectivamente:
Alternativas
Q2517640 Programação

Considere o código python a seguir.



Imagem associada para resolução da questão



Sobre a variável pred, é correto afirmar que:

Alternativas
Q2517639 Programação
Um dos principais fatores que tornam viável a aplicação de modelos grandes de linguagem (LLMs) é o controle do espaço de probabilidade de tokens através da redução de dimensionalidade do vocabulário, sem perda da capacidade de reconstruir qualquer token válido da linguagem sendo modelada.

Considerando esse objetivo, dois algoritmos que podem ser utilizados para esse fim são:
Alternativas
Q2517638 Programação
Considere-se a aplicação de um modelo grande de linguagem (LLM) com 3 bilhões de parâmetros, distribuído em formato não quantizado, meia-precisão.

A quantidade mínima de memória necessária para carregar os pesos do modelo para inferência (sem gradientes), considerando apenas o espaço ocupado pelos pesos, é:
Alternativas
Q2517637 Banco de Dados
Ao receber um conjunto de dados para elaborar um modelo preditivo, uma equipe de analistas de dados percebeu que havia uma quantidade significativa de dados faltantes em certos atributos. Foi então debatido o uso de duas técnicas para lidar com esse problema: (1) remoção de observações contendo dados ausentes e (2) “inputação” multivariável, sendo que apenas uma das duas seria aplicada.

Duas características do conjunto de dados que devem ser prioritariamente consideradas na escolha entre as duas técnicas são:
Alternativas
Q2517636 Banco de Dados
Para ser utilizado em um modelo neural de regressão, um conjunto de dados precisa ser tratado de tal forma que todos os atributos de entrada sejam representados como um ou mais valores numéricos no intervalo [0, 1].

Os atributos de uma observação são: idade (inteiro >= 18), escolaridade (fundamental, médio, superior, pós-graduação), estado de residência (Acre, Alagoas, …, Tocantins, incluindo Distrito Federal) e local de trabalho (empresa, home office, misto).

O número mínimo de valores necessários para representar uma observação com os atributos acima descritos para o modelo de regressão, de forma que não ocorra perda de informação ordinal nem inserção de vieses nos dados, é:
Alternativas
Q2517635 Banco de Dados
Visando a maximizar a eficiência de uma equipe de auditores fiscais, um sistema de classificação de documentação foi encomendado à equipe de ciência de dados, com o objetivo de decidir, com base nos documentos obtidos durante uma fiscalização, se um exame detalhado de documentação é ou não necessário.

Idealmente, o sistema permitiria aos auditores direcionar mais tempo às auditorias complexas e agilizar a análise dos casos mais simples, otimizando o custo de pessoal e equipamento especializado. Contudo, não examinar detalhadamente um caso complexo pode custar muito caro ao governo, a ponto de anular quaisquer ganhos obtidos usando o sistema com um pequeno número de erros.

Considerando esse cenário, e o fato de o sistema de classificação responder apenas “sim” ou “não” quanto à necessidade de exame detalhado, a métrica de classificação a ser maximizada pela equipe que irá implementar o sistema é:
Alternativas
Q2517634 Banco de Dados
Uma equipe de analistas de dados preparou um modelo preditivo cuja entrada consiste em planilhas contendo uma matriz de valores reais entre 1 e 10. Tais planilhas são obtidas de um sistema externo à equipe. O modelo foi treinado com um conjunto de planilhas que foi coletado pelos analistas, de forma a obter uma amostra representativa dos dados a serem utilizados. A média e o desvio padrão de duas colunas importantes foram calculados do conjunto de treinamento, como uma forma simples de verificar a consistência da distribuição dos dados, sendo seus valores 4,89 e 3,08, respectivamente. O modelo obteve bons resultados durante sua etapa de testes, com uma precisão de 94%.

Ao iniciar a operação do modelo com planilhas atuais, entretanto, os analistas observaram que o modelo teve um desempenho muito inferior, com precisão de apenas 72%. Investigando as planilhas recebidas, obtiveram a média e o desvio padrão para as duas colunas importantes com valores 5,34 e 3,68, respectivamente.

A explicação mais adequada à situação descrita é:
Alternativas
Q2517633 Algoritmos e Estrutura de Dados
Uma certa organização busca melhorar a qualidade e agilidade do seu atendimento eletrônico. Para isso um projeto foi criado para agrupar os e-mails recebidos de acordo com o tipo de problema a ser resolvido e assim repassá-los para o setor mais apropriado.

A equipe responsável pela implementação do projeto resolveu utilizar um modelo de linguagem recente para representar o máximo possível de informação contida num e-mail em um vetor de dimensão 768. Entretanto, depararam-se com o seguinte problema: as distâncias entre os vetores se mostraram muito pequenas, tornando o agrupamento por diversos algoritmos muito pouco significativo.

Com esse último problema em mente, a sequência mais apropriada de algoritmos a ser aplicada sobre os vetores, de forma a obter um agrupamento significativo dos e-mails, é:
Alternativas
Respostas
19881: E
19882: E
19883: C
19884: C
19885: D
19886: A
19887: C
19888: D
19889: B
19890: A
19891: B
19892: C
19893: B
19894: C
19895: A
19896: E
19897: D
19898: B
19899: E
19900: D