Questões de Concurso Público USP 2025 para Especialista em Laboratório (Especialidade: Inteligência Artificial e Aprendizado de Máquina)
Foram encontradas 60 questões
A Inteligência Artificial tem sido amplamente utilizada para personalizar o ensino e otimizar diagnósticos médicos. No entanto, seu uso pode gerar efeitos adversos inesperados, especialmente em contextos de desigualdade social.
Considerando as implicações éticas e práticas da IA em setores essenciais, qual abordagem representa um uso responsável da tecnologia?
Uma empresa que trabalha e armazena dados sensíveis de clientes, como informações bancárias e documentos pessoais, precisa estabelecer um protocolo seguro para o descarte de informações, garantindo conformidade com legislações como a LGPD (Lei Geral de Proteção de Dados). No entanto, devido a falhas nos procedimentos internos, documentos impressos com dados de clientes foram descartados em lixeiras comuns e, posteriormente, encontrados por terceiros.
Diante do cenário descrito, assinale a alternativa que apresenta uma análise correta sobre as implicações e responsabilidades do descarte inadequado de informações sensíveis.
Uma empresa precisa processar grandes volumes de dados e está avaliando a adoção de Apache Hadoop ou Apache Spark para suas operações. A equipe técnica analisou as características de cada tecnologia e fez as seguintes observações:
• A equipe deseja minimizar a latência no processamento dos dados.
• O projeto exige suporte para análise de dados em tempo real.
• O orçamento disponível permite a utilização de mais memória RAM, se necessário.
• A infraestrutura já possui um Data Lake armazenado no HDFS.
Com base nas informações apresentadas, assinale a alternativa que representa a escolha mais adequada e o seu principal motivo.
Considere a tabela Funcionarios de um banco de dados de uma empresa:
Qual das consultas, a seguir, retorna, corretamente, o nome, o cargo e o salário de todos os funcionários que ganham mais de R$ 3.000,00, ordenados em ordem decrescente de salário?
Durante uma análise exploratória de dados (EDA), um cientista de dados está avaliando a dispersão de um conjunto de dados financeiros que contém informações sobre variações diárias no preço de uma ação. Ele deseja utilizar uma métrica que atenda os seguintes requisitos:
• Leve em conta todos os valores da amostra para evitar que outliers distorçam excessivamente a análise.
• Seja expressa na mesma unidade de medida dos dados originais, facilitando a interpretação dos resultados.
• Permita comparar a variabilidade entre diferentes ativos, mesmo que tenham médias diferentes.
Dado esse contexto, assinale a alternativa que apresenta a técnica estatística que melhor atende aos requisitos mencionados
Uma empresa deseja implementar uma arquitetura de dados robusta para dar suporte à análise e ao processamento diário de informações. A empresa já possui um sistema de OLTP, mas agora precisa de uma solução de OLAP para análise histórica e de tendências. Além disso, a equipe de TI está considerando a criação de Data Marts para áreas de marketing, vendas e finanças, com o objetivo de melhorar a tomada de decisões.
Com base no cenário apresentado, assinale a alternativa que melhor descreve a relação entre Data Marts, OLTP e OLAP.
Em aprendizado de máquina, classificadores binários e multiclasses são usados para categorizar dados em duas ou mais classes. Considere os cenários a seguir:
1. Um sistema de detecção de fraudes bancárias, onde cada transação deve ser classificada como fraudulenta ou não fraudulenta.
2. Um modelo de classificação de espécies de flores, onde cada flor pode ser categorizada como setosa, versicolor ou virginica.
Em relação aos cenários apresentados, assinale a alternativa que descreve os modelos mais adequados para cada tipo de problema.
Uma rede de supermercados deseja entender os padrões de compra dos clientes para organizar melhor seus produtos e otimizar suas estratégias de vendas. Para isso, a equipe de análise de dados decidiu utilizar um algoritmo de descoberta de regras de associação para identificar itens, frequentemente, comprados juntos.
Assinale a alternativa que representa a métrica fundamental para avaliar a relevância de uma regra de associação.
Uma equipe de cientistas de dados está desenvolvendo um pipeline de ETL (Extract, Transform, Load) para processar grandes volumes de dados diariamente. Para isso, eles decidiram utilizar o Apache Airflow para orquestrar e monitorar o fluxo de trabalho, garantindo a execução das tarefas na ordem correta e com tolerância a falhas.
No Apache Airflow, os DAGs (Directed Acyclic Graphs) são a estrutura principal usada para definir os workflows. Dentro de uma DAG, as tarefas são organizadas e executadas de acordo com suas dependências.
Assinale a alternativa que melhor descreve o funcionamento de um DAG no Apache Airflow.
Uma empresa está implementando uma estratégia de Business Intelligence (BI) para melhorar a análise de seus dados operacionais. Para isso, a equipe de dados precisa criar dashboards interativos e realizar análises avançadas usando Power BI e Tableau.
Durante o desenvolvimento dos relatórios, os analistas se depararam com os seguintes desafios:
• Precisam criar uma métrica personalizada para calcular a média ponderada de preços com base no volume de vendas.
• Desejam otimizar o tempo de carregamento ao lidar com milhões de registros armazenados em um banco de dados relacional.
• Precisam implementar um filtro dinâmico que permita ao usuário selecionar intervalos de datas personalizados sem afetar cálculos em outros gráficos.
Com base nos desafios acima, assinale a alternativa que apresenta as melhores soluções utilizando as funcionalidades nativas do Power BI e do Tableau.
Um desenvolvedor foi contratado para criar um sistema web para uma pequena startup que deseja lançar um MVP (Produto Mínimo Viável) de uma plataforma de cursos online.
O objetivo inicial é disponibilizar um catálogo de cursos, permitir o cadastro de usuários e oferecer um painel administrativo para gerenciar os conteúdos.
A startup tem poucos recursos e precisa lançar a plataforma rapidamente. O desenvolvedor deseja escolher um framework que permita crescer e escalar o projeto futuramente, caso o produto tenha sucesso.
Considerando o cenário descrito, assinale a alternativa que apresenta a melhor escolha para o desenvolvedor e sua justificativa.
Considere os dois trechos de código a seguir, ambos escritos na Linguagem R. O primeiro utiliza o pacote tidyverse, enquanto o segundo utiliza caret para o mesmo propósito.
Em relação aos códigos apresentados, assinale a alternativa correta.
O versionamento de código é uma prática essencial no desenvolvimento de software, permitindo que múltiplos desenvolvedores colaborem de forma organizada, mantenham um histórico de alterações e revertam mudanças quando necessário. O Git, um dos sistemas de controle de versão mais populares, fornece uma série de comandos que auxiliam na gestão do código-fonte. Considere o seguinte conjunto de comandos executados em um repositório Git:
Com base nos comandos apresentados, assinale a alternativa correta.
Considere o seguinte trecho de código em Python, que tem como objetivo processar um arquivo de texto contendo dados numéricos e realizar operações sobre tais valores:
Garantindo que:
1. A média dos números lidos seja calculada e armazenada na variável media, mesmo que o arquivo esteja vazio.
2. Os números maiores que a média sejam gravados sempre em um novo arquivo chamado "saida.txt"
3. O código esteja protegido contra divisão por zero, de forma que a função tenha continuidade, mesmo que identificada a possibilidade de erro.
Assinale a alternativa que apresenta um código válido para continuar a função corretamente.
Um cientista de dados deseja analisar um conjunto de dados tabular, pré processá-lo e treinar um modelo de rede neural para prever valores contínuos. Ele utiliza Pandas para manipulação dos dados, Scikit-learn para normalização e TensorFlow/Keras para construir o modelo.
Considere o seguinte código em Python:
Com base no código apresentado, assinale a alternativa correta sobre a execução e o comportamento desse modelo.
Uma equipe de desenvolvimento de software está adotando práticas de DevOps para melhorar a qualidade e a velocidade das entregas. Para isso, decidiram implementar um pipeline CI/CD, garantindo que todas as alterações de código sejam testadas e implantadas automaticamente. No fluxo definido, o pipeline segue as etapas:
1. O código é enviado para o repositório remoto, acionando o pipeline.
2. O código é analisado e testado por ferramentas automatizadas.
3. Se os testes passarem, um build é gerado e enviado para o ambiente de staging.
4. O código é revisado e validado antes de ser implantado em produção.
Após algumas execuções do pipeline, a equipe percebeu que, quando há falha nos testes automatizados, o código não é promovido para a próxima etapa. Além disso, alguns da equipe querem que a implantação em produção ocorra automaticamente, enquanto outros preferem que seja necessária uma aprovação manual.
Com base no cenário apresentado, assinale a alternativa correta.