Questões de Concurso Público USP 2025 para Especialista em Laboratório (Especialidade: Ciência de Dados)

Foram encontradas 60 questões

Q3302379 Sistemas de Informação
Como Analista de Sistemas especializado em Ciência de Dados, você está desenvolvendo uma plataforma que integra conjuntos de dados geoespaciais provenientes de diversas fontes, como órgãos governamentais e instituições de pesquisa. Durante o processo de integração, você se depara com a seguinte citação em suas pesquisas: "Dois conjuntos de dados podem diferir tanto na projeção cartográfica quanto no datum, portanto é importante conhecer ambos para cada conjunto de dados." (LONGLEY et al., 2013, pág. 150).

Com base na citação apresentada e em relação à integração de diferentes conjuntos de dados geoespaciais, assinale a alternativa correta. 
Alternativas
Q3302380 Estatística
Em análise espacial, o Índice de Moran e o Coeficiente de Geary são estatísticas utilizadas para medir a autocorrelação espacial dos dados. Assinale a alternativa que descreve, corretamente, a função de cada uma dessas estatísticas. 
Alternativas
Q3302381 Não definido
Sabe-se que, na geoinformática, os modelos digitais são usados para representar a elevação do terreno e de suas características e que os Modelos Digitais do Terreno (MDT) e os Modelos Digitais da Superfície (MDS) possuem aplicações distintas em diversas áreas.
Assinale a alternativa que apresenta uma aplicação específica de cada um dos modelos citados.
Alternativas
Q3302382 Não definido
No mapeamento urbano por sensoriamento remoto, diferentes sensores e técnicas são utilizados para analisar a ocupação do solo e a dinâmica das cidades. Entre as abordagens mais comuns, estão a análise espectral e a detecção de mudanças temporais.

Considerando o contexto apresentado, qual dos desafios, a seguir, representa um obstáculo significativo na aplicação de séries temporais de imagens de satélite para monitoramento da expansão urbana?
Alternativas
Q3302383 Noções de Informática
Considere um problema de classificação binária onde deseja-se prever se um cliente comprará ou não um determinado produto, com base em características como idade, renda e histórico de compras. Em relação aos algoritmos de Machine Learning a seguir, assinale a alternativa que apresenta o algoritmo mais adequado para começar a abordagem desse problema de forma interpretável e eficiente em termos computacionais.
Alternativas
Q3302384 Programação
No contexto do desenvolvimento de aplicações geoweb modernas, é necessário integrar tecnologias de front-end e back-end para exibir e manipular dados geoespaciais. Assinale a alternativa que representa a função do back-end em uma aplicação geoweb.
Alternativas
Q3302385 Banco de Dados
Uma startup de e-commerce planeja a infraestrutura de seu banco de dados para armazenar e gerenciar informações sobre produtos, pedidos e usuários. O sistema deve garantir alta consistência nas transações financeiras, mas também precisa lidar com um grande volume de dados não estruturados, como avaliações dos clientes e interações personalizadas. Além disso, a empresa deseja ter boa escalabilidade para lidar com um número crescente de usuários e transações ao longo do tempo.

Considerando a necessidade descrita, assinale a alternativa que apresenta o tipo de banco de dados mais adequado como base principal para essa aplicação.
Alternativas
Q3302386 Banco de Dados
Uma empresa de mídia digital usa o banco de dados MongoDB para armazenar informações sobre artigos publicados em sua plataforma. Cada documento na coleção artigos contém os seguintes campos: 

json {  "_id":ObjectId("65a4f9c9e1234567890abcde"),  "titulo": "Avanços em Machine Learning",  "autor": "João Silva",  "categoria": "Inteligência Artificial",  "visualizacoes": 1250,  "publicado_em":ISODate("2024-02-10T12:00:00Z"),  "tags": ["IA", "Deep Learning", "Redes Neurais"] } 



A equipe de ciência de dados precisa executar algumas consultas para analisar os artigos publicados e gerar relatórios. Assinale a alternativa que apresenta o comando que retorna todos os artigos da categoria "Inteligência Artificial", com número de visualizações que seja maior ou igual a 1000, ordenados por número de visualizações em ordem decrescente.
Alternativas
Q3302387 Estatística
A Regressão Geograficamente Ponderada (GWR - Geographically Weighted Regression) é uma técnica de análise espacial que pode ser aplicada em diversas situações, como por exemplo, na análise de desmatamento. Essa técnica leva em consideração variáveis não estacionárias, como o clima, fatores demográficos e características do ambiente físico e que modelam as relações locais entre esses preditores, gerando um resultado de interesse. Assinale a alternativa que descreve uma característica da GWR.
Alternativas
Q3302388 Não definido
Uma empresa de tecnologia está implementando um novo processo ágil para sua equipe de ciência de dados. O principal desafio é que os projetos de ciência de dados envolvam tarefas exploratórias e imprevisíveis, onde nem sempre há um produto final definido desde o início. Além disso, a equipe precisa de um sistema que permita a execução de múltiplas tarefas, simultaneamente, sem exigir que todas sejam planejadas em ciclos fixos.

Considerando o contexto descrito, assinale a alternativa que apresenta a metodologia ágil, mais adequada, para gerenciar esse tipo de fluxo de trabalho.
Alternativas
Q3302389 Agrimensura
Assinale a alternativa que descreve a diferença entre um Sistema de Coordenadas Geodésicas e um Sistema de Coordenadas Geográficas.
Alternativas
Q3302390 Não definido
De acordo com Longley (2015, pág. 352), “a análise espacial pode revelar coisas que, de outro modo, seriam invisíveis - ela pode tornar explícito, o que está implícito. ” Diversos métodos apoiam a análise espacial em um SIG (Sistemas de Informação Geográfica), dentre eles, as operações de intersecção, buffer e união são fundamentais para a manipulação de dados geoespaciais. Assinale a alternativa que descreve o uso das operações citadas.
Alternativas
Q3302391 Sistemas de Informação
A GeoWeb é uma plataforma digital que combina Sistemas de Informação Geográfica (SIG) com a World Wide Web. Ela permite aos usuários interagir com dados geográficos e criar conteúdo geoespacial de forma dinâmica e acessível. Para garantir a interoperabilidade entre diferentes sistemas e plataformas, diversos padrões foram estabelecidos pelo Open Geospatial Consortium (OGC). Qual das alternativas, a seguir, descreve a relação entre a GeoWeb e os padrões OGC?
Alternativas
Q3302392 Não definido
O sensoriamento remoto é uma técnica essencial para o mapeamento urbano. Ele é utilizado para obter informações sobre as propriedades físicas, químicas e biológicas de objetos, sem estabelecer contato físico direto. A qualidade da informação extraída das imagens depende de três aspectos fundamentais da resolução: espacial, espectral e temporal. Com base nos conceitos de resolução, assinale a alternativa que descreve, corretamente, a diferença entre os três aspectos fundamentais de resolução.
Alternativas
Q3302393 Não definido
A Modelagem Digital do Terreno (MDT) e a Modelagem Digital de Superfície (MDS) são representações tridimensionais da superfície da terra, que são obtidas a partir de fotos de satélite, fotos aéreas e imagens de drones que são cruzadas e que geram percepção tanto da distância, como de profundidade. A distinção entre os dois modelos é essencial para aplicações como planejamento urbano, hidrologia e engenharia civil. Observe as imagens a seguir: 

Imagem associada para resolução da questão

Em relação às modelagens apresentadas e considerando os conceitos de MDS e MDT, assinale a alternativa que descreve a diferença entre MDT e MDS (a identificação do tipo da modelagem nas imagens, foi excluída propositalmente). 
Alternativas
Q3302394 Sistemas Operacionais
Um cientista de dados está desenvolvendo um modelo de Machine Learning e deseja garantir que sua aplicação rode de maneira reprodutível em diferentes máquinas, sem precisar configurar manualmente todas as dependências.Com essa finalidade, ele decide utilizar Docker para criar um ambiente isolado.
Qual dos comandos, a seguir, é utilizado para construir uma imagem Docker, a partir de um Dockerfile, para que o cientista de dados possa compartilhar seu ambiente de desenvolvimento com outras pessoas?
Alternativas
Q3302395 Noções de Informática
As Árvores de Decisão são algoritmos de aprendizagem supervisionada usados para classificação e regressão, modelando decisões com base em regras derivadas dos dados. Elas são amplamente utilizadas em diversas áreas, como saúde, finanças e análise de risco.
Como exemplo, considere a Árvore de Decisão (fictícia), a seguir, que classifica pacientes com base no risco de ter um infarto. As decisões são feitas com base em três critérios: idade, peso e se é fumante, ou não.

Imagem associada para resolução da questão


Em relação ao funcionamento das Árvores de Decisão, assinale a alternativa que descreve seu princípio de operação e comportamento na modelagem de dados.
Alternativas
Q3302396 Engenharia de Software
No contexto do DevOps, um pipeline de CI (Continuous Integration)/CD (Continuous Delivery) é essencial para garantir a automação do ciclo de vida do software, desde a integração do código até a entrega e implantação contínuas. Considere um pipeline típico que segue as etapas: build, test, deploy e monitoring, conforme a imagem a seguir:

Imagem associada para resolução da questão

Assinale a alternativa que descreve o objetivo dessas etapas no pipeline de DevOps.
Alternativas
Q3302397 Engenharia de Software
Uma equipe Scrum está trabalhando em um projeto de e-commerce e precisa entregar uma nova funcionalidade de carrinho de compras em duas Sprints. Durante a Sprint Review, o Product Owner percebe que algumas funcionalidades entregues não atendem aos critérios de aceitação definidos. Além disso, a equipe de desenvolvimento relata que as estimativas feitas no Sprint Planning foram insuficientes, e o Scrum Master percebe que a velocidade do time diminuiu. Diante do cenário apresentado, qual deve ser a melhor abordagem para garantir a melhoria contínua e a entrega de valor ao final da próxima Sprint?
Alternativas
Q3302398 Banco de Dados
Banco de dados relacionais utilizam a linguagem SQL para manipulação de dados, permitindo a realização de consultas complexas com o uso de subqueries e funções agregadas. Suponha que, em um banco de dados de uma empresa, a tabela Vendas tenha a estrutura a seguir:

CREATE TABLE Vendas (    id_venda INT PRIMARY KEY,    id_cliente INT,    valor DECIMAL(10,2),    data_venda DATE ); 
A empresa deseja encontrar os clientes que realizaram pelo menos uma venda acima da média de todas as vendas registradas. Qual das seguintes consultas retorna corretamente esse resultado?
Alternativas
Respostas
41: B
42: C
43: D
44: E
45: C
46: B
47: D
48: E
49: C
50: B
51: D
52: B
53: E
54: B
55: B
56: A
57: A
58: E
59: A
60: D