Questões de Concurso Público UFC 2025 para Analista de Tecnologia da Informação / Área: Ciência de Dados

Foram encontradas 50 questões

Q3162130 Banco de Dados
Considere um banco de dados relacional que armazena informações sobre diversas corridas de rua. O esquema desse banco de dados relacional é descrito por apenas uma tabela chamada: Corrida (bateria: integer, nome: varchar(64), tempo: float). Com base nessa tabela, assinale a alternativa que representa uma consulta SQL que retorna o nome do ganhador de cada bateria, a bateria e o tempo respectivamente.
Alternativas
Q3162131 Banco de Dados
MapReduce é um modelo de programação utilizado no processamento de grandes volumes de dados. Seu sucesso é decorrente do uso facilitado para processar dados de forma distribuída. Em seu uso, o usuário precisa especificar uma função de Map para gerar os pares de chave/valor. Além disso, torna-se necessário definir a função de Reduce para juntar os valores intermediários processados associados a uma mesma chave. Qual das seguintes ferramentas implementa esse modelo de programação?
Alternativas
Q3162132 Banco de Dados
O pré-processamento de dados é uma tarefa necessária para a mineração de dados. Alguns problemas como integração de esquema, tratamento de dados redundantes, detecção e resolução de conflitos de valores são tratados em qual das etapas de pré-processamento de dados?
Alternativas
Q3162133 Banco de Dados
Em qual esquema de modelagem multidimensional existem as tabelas de fatos e as tabelas de dimensão sem nenhum tipo de normalização?
Alternativas
Q3162134 Banco de Dados
No modelo multidimensional, os dados são organizados em diversas dimensões, cada uma estruturada em múltiplos níveis de abstração definidos por hierarquias de conceitos. Operações OLAP podem ser aplicadas para diferentes finalidades, como realizar uma agregação que reduz a dimensionalidade ou explorar dados com maior nível de detalhe, introduzindo novas dimensões. Com base nas operações descritas, assinale a alternativa que identifica corretamente os nomes dessas operações, respectivamente.
Alternativas
Q3162135 Estatística
Considere três transações (T1, T2 e T3) onde cada transação guarda os itens comprados em um supermercado. A transação T1 é definida por {macarrão, tomate}, T2 por {macarrão, tomate, queijo} e T3 por {tomate, queijo}. Utilizando as noções de regras de associação o suporte e a confiança para {macarrão, tomate} → {queijo} são respectivamente:
Alternativas
Q3162136 Engenharia de Software
Aprendizado de máquina é um objeto da inteligência artificial que desenvolve técnicas capazes de reconhecer padrões a partir de dados. Algumas abordagens se destacam, como o aprendizado supervisionado e o não supervisionado, bem como o aprendizado por reforço. Com base nessas três abordagens, assinale a alternativa que contenha algoritmos de aprendizado supervisionado, aprendizado não supervisionado e aprendizado por reforço, respectivamente.
Alternativas
Q3162137 Engenharia de Software
Funções de ativação exercem um papel fundamental em redes neurais, habilitando os modelos a capturarem padrões complexos não lineares dos dados. Entretanto, especificamente em redes neurais profundas essas funções podem implicar em um problema conhecido chamado gradient vanishing (desvanecimento do gradiente). Afim de evitar esse problema, assinale a função de ativação que mitiga o gradiente vanishing.
Alternativas
Q3162138 Sistemas Operacionais
A regra do cotovelo é uma técnica visual amplamente utilizada para identificar a quantidade ideal de agrupamentos que melhor representam os dados, sendo especialmente aplicada em qual método de clusterização?
Alternativas
Q3162139 Algoritmos e Estrutura de Dados
O uso de índices em bancos de dados relacionais pode otimizar o desempenho de consultas, permitindo acesso mais rápido aos dados e, portanto, reduzindo tempo de processamento. Diferentes tipos de consultas possuem diferentes necessidades do ponto de vista da estrutura do índice. Para consultas por intervalo, como por exemplo, idade >= 25 AND idade < 30, qual melhor estrutura de dados para o índice?
Alternativas
Q3162140 Programação
NumPy é um pacote para computação científica na linguagem Python. Segue o seguinte código Python utilizando Numpy:

import numpy as np
print(np.array([[1,2],[3,4]]).T)

Com base nesse código fonte acima, assinale a alternativa que apresenta a impressão do resultado.
Alternativas
Q3162141 Programação
A construção de dashboards eficazes é essencial para transformar dados em insights visuais, permitindo decisões mais rápidas e informadas. Para a criação de um dashboard interativo para visualizar dados de forma simples e rápida, sem a necessidade de escrever código em front-end ou configurar servidores complexos. Qual das alternativas abaixo é a melhor ferramenta para essa tarefa?
Alternativas
Q3162142 Engenharia de Software
O Tableau é uma ferramenta poderosa para a análise de dados, oferecendo diversas funcionalidades que permitem explorar e visualizar informações de forma clara e intuitiva. No Tableau, o que é um bin e qual é sua principal função?
Alternativas
Q3162143 Engenharia de Software
O Git é uma ferramenta poderosa para o controle de versões, permitindo que os desenvolvedores acompanhem e revertam alterações no código de forma eficiente. Em alguns casos, pode ser necessário desfazer um commit recente, seja para corrigir um erro ou refazer alguma modificação. No Git, qual é o comando correto para reverter o último commit realizado?
Alternativas
Q3162144 Engenharia de Software
LangChain é uma biblioteca projetada para simplificar o desenvolvimento de aplicações baseadas em linguagem natural, aproveitando modelos de linguagem como o GPT. No LangChain, qual é a principal função dos "chains"?
Alternativas
Q3162145 Engenharia de Software
Como o algoritmo Byte Pair Encoding (BPE) impacta o processo de aprendizagem de Large Language Models (LLMs), e qual é a principal vantagem de sua aplicação? 
Alternativas
Q3162146 Engenharia de Software
Em um sistema de Geração Aumentada via Recuperação (RAG, do inglês Retrieval-Augmented Generation), os embeddings vetoriais desempenham um papel crucial no processo de recuperação de informações. Qual das opções abaixo descreve melhor sua finalidade e funcionalidade?
Alternativas
Q3162147 Engenharia de Software
No processamento de linguagem natural (NLP), qual técnica é utilizada para reduzir palavras à sua raiz ou forma base, removendo afixos como sufixos e prefixos e podendo obter uma palavra inexistente?
Alternativas
Q3162148 Estatística
Termos como variáveis numéricas, categóricas, binárias, contínuas e discretas são comumente usados para diferenciar os tipos de dados. Em relação às variáveis qualitativas, qual das opções abaixo apresenta um exemplo de variável qualitativa nominal e uma variável qualitativa ordinal, respectivamente?
Alternativas
Q3162149 Engenharia de Software
No contexto de MLOps, o termo Model Drift refere-se a mudanças que afetam o desempenho de um modelo de aprendizado de máquina ao longo do tempo. Qual das opções abaixo descreve corretamente um exemplo ou causa de Model Drift?
Alternativas
Respostas
21: C
22: A
23: C
24: A
25: B
26: C
27: A
28: B
29: D
30: C
31: B
32: C
33: D
34: B
35: D
36: A
37: D
38: B
39: C
40: D