Questões de Concurso Comentadas para analista - ciências sociais

Foram encontradas 239 questões

Resolva questões gratuitamente!

Junte-se a mais de 4 milhões de concurseiros!

Q3048126 Engenharia de Software
Em aplicações modernas de Processamento de Linguagem Natural, usando Grandes Modelos de Linguagem (Large Language Models – LLM) é comum a necessidade de usar informações relevantes que estão em documentos novos e privados, que não foram usados no pré-treinamento dos modelos de LLM. Considerando que esses documentos podem ser longos e em grande quantidade, que o tamanho do contexto usado na chamada à Application Programming Interface (API) da LLM é limitado, e ainda pensando que os custos de processar são muitas vezes calculados por quantidade de tokens, foi desenvolvida a técnica conhecida como Retrieval Augmented Generation (RAG).
Considerando-se esse contexto, qual é a característica da técnica RAG?
Alternativas
Q3048121 Engenharia de Software
Um programador estava trabalhando no branch solvebugio e acabou o serviço. Após fazer o commit final nesse branch, ele deseja passar todas as mudanças feitas no branch solvebugio para o branch main, fazendo a integração correta de mudanças.
Considerando-se esse contexto e as melhores práticas de controle de versão, quais comandos Git esse programador deve usar para realizar essa tarefa?
Alternativas
Q3048120 Engenharia de Software
Uma equipe de desenvolvimento de Inteligência Artificial (IA) em uma empresa de tecnologia está implementando um sistema de recomendação baseado em aprendizado de máquina. Durante o processo de implementação, a equipe precisa estar atenta aos potenciais riscos e vulnerabilidades associados ao uso da IA. O sistema utiliza grandes volumes de dados históricos de clientes para treinar seus modelos. Há uma preocupação com a possibilidade de invasores manipularem a entrada de dados para enganar o modelo e gerar saídas indesejadas ou incorretas. A equipe deve também garantir que o modelo não exponha dados sensíveis dos clientes.
Considere as seguintes afirmativas com relação à mitigação dos riscos identificados:

I - adotar uma abordagem de fairness-aware learning para corrigir potenciais vieses no modelo, garantindo que as recomendações sejam justas para todos os grupos de usuários.
II - implementar métodos de robustness testing para simular ataques adversariais e avaliar a resiliência do modelo, e realizar auditorias regulares para identificar e corrigir vieses algorítmicos.
III - implementar técnicas de data augmentation para aumentar a diversidade dos dados de treinamento, reduzindo o risco de viés algorítmico, e adotar uma estratégia de monitoramento contínuo para detectar e mitigar ataques adversariais.
IV - utilizar técnicas de differential privacy durante o treinamento do modelo para proteger dados sensíveis e garantir que as previsões do modelo não revelem informações específicas dos clientes.

Estão corretas as seguintes afirmativas: 
Alternativas
Q3048117 Banco de Dados
Uma empresa está desenvolvendo um dashboard interativo para monitorar o desempenho das vendas em tempo real. O objetivo é fornecer uma visão clara e acessível para diferentes níveis de usuários, desde gerentes executivos até analistas de dados. Foram definidos os seguintes requisitos:

1. Os dados de vendas precisam ser visualizados por região, produto e período de tempo.
2. O dashboard deve permitir aos usuários explorar dados específicos por meio de interações como filtros e drill-downs.
3. A organização dos elementos visuais deve ser intuitiva, priorizando informações críticas e mantendo um layout claro e acessível.

Com base nas boas práticas de design de dashboards, qual abordagem deve ser adotada para garantir que o dashboard seja eficaz e acessível para todos os usuários?
Alternativas
Q3048116 Engenharia de Software
Ao avaliar a performance de diversos modelos preditivos para um problema de regressão e outro de classificação, várias métricas podem ser utilizadas para determinar qual modelo oferece o melhor desempenho. Considere as métricas para regressão e classificação, bem como as técnicas de detecção de overfitting e underfitting.
Nesse contexto, quais métricas devem ser utilizadas para determinar qual modelo oferece o melhor desempenho?
Alternativas
Q3048114 Governança de TI
Uma empresa está implementando um programa de governança de dados para melhorar a qualidade e a integridade dos dados que utiliza em suas operações diárias. As seguintes diretrizes foram passadas ao time de implantação:

1. Garantir que os dados sejam precisos, completos e atualizados em tempo real, para apoiar a tomada de decisões estratégicas.
2. Implementar políticas que assegurem a conformidade com regulamentos de privacidade de dados, como a Lei Geral de Proteção de Dados Pessoais (LGPD).
3. Adotar as melhores práticas do Data Management Body of Knowledge (DMBOK) para estruturar seu programa de governança de dados.

Com base nos conceitos de governança de dados do DMBOK, quais ações são necessárias para implementar as diretrizes mencionadas? 
Alternativas
Q3048113 Engenharia de Software
Como parte do processo de desenvolvimento de uma aplicação para analisar grandes volumes de textos, diversas tarefas de Processamento de Linguagem Natural (NLP, sigla em inglês) estão sendo implementadas para melhorar a eficácia e a precisão dessa aplicação.
Diante disso, para a aplicação dessas tarefas, é necessário
Alternativas
Q3048112 Engenharia de Software
Uma equipe de cientistas de dados está desenvolvendo um modelo preditivo e deseja otimizar seus hiperparâmetros para maximizar a performance do modelo.
Considerando-se as técnicas de otimização de hiperparâmetros, para encontrar a configuração de hiperparâmetros, essa equipe de cientistas deverá
Alternativas
Q3048111 Banco de Dados
Uma equipe de ciência de dados está trabalhando na construção de um modelo preditivo utilizando um grande conjunto de dados. Durante esse processo, os cientistas de dados estão realizando o feature engineering para criar e selecionar as variáveis mais relevantes, além de aplicar técnicas de divisão de dados para garantir a eficácia e a generalização do modelo.
Considerando-se esse contexto, qual combinação de técnicas maximizará a performance do modelo?
Alternativas
Q3048109 Banco de Dados
Um conjunto de dados numéricos com significativa diversidade foi apresentado à equipe de análise de dados de uma empresa. Como parte do processo decisório, os analistas necessitavam transformar um dos atributos numéricos em faixas de valores, a fim de permitir classificá-los em um universo de possibilidades. Para isso, decidiram, na etapa de enriquecimento de dados, criar um atributo, derivado do atributo numérico supracitado, em um processo de transformação de dados conhecido por discretização.
Uma das características das técnicas de discretização é que
Alternativas
Q3048108 Arquitetura de Software
O Microsoft Team Data Science Process (TDSP) é uma metodologia que define, entre outros conceitos, um ciclo de vida para projetos de ciência de dados.
A TDSP possui cinco estágios principais, de modo que na etapa de
Alternativas
Q3048107 Banco de Dados
Em um Sistema Gerenciador de Banco de Dados (SGBD), os índices são estruturas de dados que têm por objetivo tornar mais rápido o acesso aos dados. Índices são utilizados tanto em SGBD relacionais quanto em SGBD NoSQL.
Considerando-se uma tabela T1 em um SGBD relacional, quanto a esses índices, verifica-se que
Alternativas
Q3048106 Banco de Dados
O modelo relacional de dados é amplamente utilizado em bancos de dados. A organização de dados em tabelas (relações), com suas respectivas linhas (tuplas) e colunas (atributos), é de fácil compreensão. Os Sistemas Gerenciadores de Bancos de Dados Relacionais (SGBDR) tornam possível persistir dados em tabelas com qualidade e recuperar esses mesmos dados de forma rápida e eficiente.
Segundo o modelo relacional de dados, uma tabela pode ter
Alternativas
Q3048105 Banco de Dados
Data warehouses (DW) e data lakes (DL) são repositórios de dados especializados, com objetivos distintos dos bancos de dados relacionais e NoSQL.
Nesse contexto, ao comparar DW a DL, verifica-se que
Alternativas
Q3048104 Banco de Dados
Os bancos de dados relacionais permitem a modelagem e a persistência de dados estruturados. Uma característica de tais bancos de dados é que eles possuem metadados. Considere que um banco de dados possui uma tabela relacional chamada PRODUTO e que essa tabela possui atributos, tais como a identificação do produto, o nome do produto e o seu valor de venda.
Nesse cenário, os metadados relativos à tabela PRODUTO são utilizados pelo seu respectivo Sistema Gerenciador de Banco de Dados Relacionais (SGBDR) para
Alternativas
Q3040173 Geografia
Considere o texto sobre a questão urbana no Brasil.

Em 2023, a Pesquisa Data Favela revelou que há mais de 10 mil favelas espalhadas pelo Brasil. Se somadas, produziriam o terceiro maior estado em número de habitantes, com movimentações financeiras de mais de 200 bilhões de reais (valor crescente em relação aos últimos anos). Os dados do Data Favela revelam que, nos últimos 10 anos, o número de favelas espalhadas pelo Brasil dobrou, aumentando o desafio territorial urbano e regional do país. Renato Meirelles, responsável pela pesquisa, compreende que “a favela é a expressão demográfica das desigualdades sociais” e explica, a partir disso, o crescimento tão significativo na última década: as condições de vida da população brasileira têm piorado, as reformas regressivas [...] arrastam a população para o mercado informal de emprego ou para o desemprego, trazem de volta a fome para a vida de mais famílias e aumentam a procura por espaços de moradia em territórios de favelas.
Disponível em: https://www.ige.unicamp.br/lehg/o-censo-2022- e-as-favelas-do-brasil/. Acesso em: 2 ago. 2024. Adaptado.

Segundo o Censo 2022, as duas favelas mais populosas do país encontram-se, respectivamente, nos seguintes lugares:
Alternativas
Q3040172 Banco de Dados
O CRISP-DM (Cross-Industry Standard Process for Data Mining) é uma metodologia amplamente utilizada para a análise e mineração de dados. Ela fornece um framework estruturado para realizar projetos de análise de dados, cobrindo desde a compreensão inicial do problema até a implementação das soluções. O ciclo CRISP-DM é composto por seis etapas principais: (i) Compreensão do negócio; (ii) Compreensão dos dados; (iii) Preparação dos dados; (iv) Modelagem; (v) Avaliação; (vi) Desenvolvimento. Na fase de compreensão dos dados, as tarefas desempenhadas são:
Alternativas
Q3040171 Serviço Social
Os programas sociais e de transferência de renda são considerados políticas públicas importantes para a diminuição da pobreza absoluta e da pobreza em suas diferentes dimensões, podendo variar segundo a idade, gênero, cultura e outros contextos sociais e econômicos. É um programa de política pública voltado para a garantia de renda:
Alternativas
Q3040158 Geografia
No Relatório Mundial das Cidades 2022, publicado pelo Programa das Nações Unidas para Assentamentos Humanos (ONU-Habitat), aponta-se que a população mundial será 68% urbana até 2050. O relatório contém uma visão abrangente sobre a realidade das cidades, as tendências da política urbana e as perspectivas do desenvolvimento urbano sustentável e a conclusão de que cidades podem ser lugares mais equitativos, ecológicos e baseados no conhecimento. Nessa visão trazida pelo relatório e suas conclusões, há reconhecimento de que a(s)
Alternativas
Q3040155 Conhecimentos Gerais
O desenvolvimento sustentável e a responsabilidade social de empresas e de indivíduos são conceitos largamente utilizados devido às questões socioambientais enfrentadas pela humanidade. O desenvolvimento passa, nesse sentido, por garantir os serviços ambientais e ecossistêmicos necessários à manutenção da biodiversidade e da qualidade de vida da humanidade. A gestão de resíduos vem sendo tema de primeira linha para a sustentabilidade porque
Alternativas
Respostas
1: C
2: E
3: E
4: C
5: D
6: D
7: B
8: C
9: E
10: C
11: B
12: C
13: A
14: D
15: C
16: C
17: C
18: C
19: B
20: C