Questões de Concurso Público TCE-PA 2024 para Auditor de Controle Externo - Área Administrativa - Ciência de Dados

Foram encontradas 100 questões

Q2571744 Engenharia de Software
Modelos de aprendizagem de máquina são, em geral, avaliados com métricas que indicam os quão poderosos e relevantes eles são. Entre exemplos de métricas de avaliação utilizadas para modelos de classificação binária, podemos citar:

• Taxa de precisão (razão entre verdadeiros positivos e o total dos verdadeiros positivos e falsos positivos); • Taxa de sensibilidade (razão entre verdadeiros positivos e o total dos verdadeiros positivos e falsos negativos, também conhecida por recall); e • Escore F1 (F1-score, também chamado de F-measure), que relaciona as taxas de precisão e de sensibilidade. Suponha a existência de um modelo de classificação binária cuja taxa de precisão é de 90,00% e cuja taxa de sensibilidade é de 75,00%. Utilize aproximação de duas casas decimais.
O escore F1 referente a esse modelo é 
Alternativas
Q2571745 Engenharia de Software
Diferentes técnicas de classificação são utilizadas em aprendizado de máquina para organizar e categorizar dados de acordo com características predefinidas.
Com respeito a técnicas de classificação em aprendizado de máquina, analise as afirmativas a seguir.
I. A regressão logística determina um hiperplano no espaço n- dimensional para separar as instâncias de dados de entrada em partições de acordo com suas classes. II. As máquinas de vetores de suporte (Support Vector Machines - SVM) consistem em uma abordagem probabilística, determinando uma distribuição de probabilidades de que uma nova instância de dados de entrada pertença as respectivas classes. III. O algoritmo K vizinhos mais próximos (K Nearest Neighbors - KNN) classifica uma nova instância de dados de entrada conforme a classe das instâncias mais próximas já observadas.
Está correto o que se afirma em
Alternativas
Q2571746 Estatística
Modelos de previsão podem ser obtidos a partir do uso detécnicas de regressão. Dentre essas técnicas, pode-se citar atécnica de regressão polinomial.
Considere o conjunto de dados e a informação a seguir:
Q83_1.png (282×61)


Informação:  Q83_2.png (285×61)


Deseja-se encontrar um modelo de regressão polinomial de 2ograu Y = α0 + α1 X + α2 X2 que melhor se encaixe nesse conjunto de dados.

Estimando-se pelo método dos mínimos quadrados, os valores deα0, α1 e α2 serão dados, respectivamente, por
Alternativas
Q2571747 Sistemas Operacionais
Alguns algoritmos de aprendizado de máquina servem para agrupar instâncias de dados em clusters, podendo ser utilizados para tarefas como segmentação de imagens, ou segmentação social (por exemplo, para agrupamento de clientes em uma mesma categoria.
Dois dos mais populares algoritmos são o K-means e o DBSCAN. A respeito desses algoritmos, relacione-os com suas principais características:
1. K-means 2. DBSCAN
( ) Precisa da definição de um número inicial de agrupamentos. ( ) Mais robusto à ocorrência de outliers, por sua provável localização em regiões de baixa densidade de dados. ( ) Precisa da definição do número mínimo de vizinhos e do raio da vizinhança para determinar limites dos agrupamentos. ( ) Determina centróides dos agrupamentos e agrupa as instâncias de dados em função de uma métrica de distância entre as instâncias e os centróides.
Assinale a opção que indica a relação correta, na sequência apresentada.
Alternativas
Q2571748 Engenharia de Software
A análise de componentes principais (Principal Component Analysis - PCA) é uma técnica de redução de dimensionalidade de dados utilizada em diversas aplicações, tais como em compressão de imagens e em processamento de linguagem natural.
Em relação à análise de componentes principais, avalie se as afirmativas a seguir são verdadeiras (V) ou falsas.
( ) Permite a identificação de correlações e de estruturas de menor dimensionalidade na distribuição espacial dos dados, caracterizadas pelas direções onde há maior variância. ( ) Envolve o cálculo de autovalores e autovetores de matrizes de covariâncias, determinando-se as componentes principais das distribuições de dados. ( ) É adequada para identificar correlações não-lineares entre os dados de um conjunto de alta dimensionalidade, projetando estruturas em espaços vetoriais de menores dimensões.
As afirmativas são, respectivamente,
Alternativas
Q2571749 Matemática
A decomposição em valores singulares (Singular ValueDecomposition - SVD) é uma técnica para determinar relaçõesentre dados, sendo utilizada no projeto de sistemas derecomendação. Considere a matriz
Q86.png (88×36)


e sua decomposição em valores singulares dada por A = Σ VT .Nesse caso, avalie se as afirmativas a seguir são verdadeiras (V)ou falsas (F).
( ) Os elementos da diagonal principal de Σ são √26 e √6. ( ) Os elementos da primeira coluna da matriz podem ser dados por 2/√13 e 3/√13. ( ) Os elementos da primeira coluna da matriz V podem ser dados por − 3/√13 e 2/√13 .
As afirmativas são, respectivamente,

Alternativas
Q2571750 Engenharia de Software
As redes neurais artificiais (Artificial Neural Networks - ANN) constituem um grupo de algoritmos inspirados nas funções dos neurônios no cérebro humano. Diversas arquiteturas de redes neurais são utilizadas para diferentes problemas, conforme suas funcionalidades.
Existe uma arquitetura de rede neural específica, especialmente apropriada ao reconhecimento de padrões de imagens e vídeos, por possuir as seguintes propriedades:
• As informações fluem apenas em uma direção. • As informações são propagadas em diferentes camadas neurais que filtram características (isto é, as features). • As informações são propagadas em diferentes camadas que reduzem sua dimensionalidade.
Das opções a seguir, as redes que mais aderem às propriedades listadas acima são as redes 
Alternativas
Q2571751 Programação
As arquiteturas de modelos de linguagem de larga escala (Large Language Models - LLM) surgiram recentemente, revolucionando a área de inteligência artificial nas áreas de processamento e geração de texto.
A arquitetura desses modelos baseia-se, majoritariamente, nas redes neurais do tipo transformers. Relacione as arquiteturas a seguir com suas características principais:
1. BERT 2. GPT 3. T5
( ) Utiliza decoders das redes transformer para prever novos tokens a partir de uma sequência, tornando-se ideal para a geração de textos. ( ) Utiliza encoders das redes transformer para "entender" o contexto de frases, tornando-se ideal para classificação de textos. ( ) Utiliza encoders e decoders das redes transformer, sendo adaptável a situações em que seja necessário gerar novos textos ou processar textos para "entender" o contexto das frases. ( ) Em comparação com as outras arquiteturas, tem menor necessidade de fine-tuning para melhora de performance. 
A relação correta, na ordem apresentada, é
Alternativas
Q2571752 Engenharia de Software
Alguns dos primeiros modelos de linguagem de larga escala desenvolvidos tendiam a gerar resultados incorretos com excesso de confiança, caracterizando o que se convencionou chamar de alucinações dos modelos. Uma estratégia de mitigação das alucinações é o uso da técnica de Geração Aumentada por Recuperação, ou Retrieval-Augmented Generation (RAG).
A respeito da RAG, avalie as afirmativas a seguir.
I. Baseia-se na combinação de sistemas de recuperação de informações e de modelos generativos capazes de produzir novos textos. II. Permite aos modelos buscarem informações relevantes em bases de dados mais confiáveis durante o processamento das consultas dos usuários (user queries), viabilizando melhor adequação a contextos e melhor qualidade das respostas. III. Não altera os parâmetros dos modelos generativos, e, portanto, não influencia o treinamento das redes neurais com informações recuperadas de bases de dados externas.
Está correto o que se afirma em
Alternativas
Q2571753 Programação
Em processamento de linguagem natural (Natural Language Processing - NLP), é fundamental que sejam utilizadas técnicas para representar palavras numericamente como vetores. As representações numéricas são importantes para capturar relações semânticas entre as palavras, permitindo, por exemplo, processamentos para a detecção de similaridades entre palavras e o desenvolvimento de chatbots.
Entre as técnicas de NLP para a representação numérica de palavras destacam-se as seguintes:
Alternativas
Q2571754 Programação
Com relação ao framework pytest, da linguagem de programação Python, avalie as afirmativas a seguir:
I. O comando pytest executa os arquivos no formato test_*.py ou *_test.py no diretório corrente e nos subdiretórios. II. O comando abaixo mostra os 5 testes com maior tempo de duração. >>> pytest -vv --durations=5 III. É possível invocar o framework pytest usando o próprio interpretador do Python por meio do comando abaixo: >>> python -m pytest
Está correto o que se afirma em
Alternativas
Q2571755 Programação
Considerando os parâmetros (flags) usados na linha de comando ao executar o framework pytest, aquele utilizado para iniciar o debugger interativo do Python é
Alternativas
Q2571756 Programação

Considere a biblioteca Pandas e o trecho de código a seguir:


import pandas as pd

data = {'Cidade': ['Parauapebas', 'Marabá', 'Altamira'], 'Região': ['I', 'II', 'II'], 'Jan': [150, 395, 300], 'Fev': [275, 195, 250], 'Mar': [250, 280, 200] } 


df = pd.DataFrame(data, columns=['Cidade','Região','Jan', 'Fev','Mar']) print(df.groupby('Região')[['Jan', 'Fev', 'Mar']].mean().iloc[1,2]) 


Assinale a opção que apresenta o valor numérico exibido como saída ao comando print.

Alternativas
Q2571757 Programação
Com relação aos tipos estruturados da linguagem de programação Python 3, avalie as afirmativas a seguir:
I. A tentativa de utilizar conjunto (set) como chave de um dicionário (dict) retorna erro. II. O conjunto (set) não permite elementos repetidos. III. O construtor do tipo list retorna erro ao receber uma string como argumento (entrada).
Está correto o que se afirma em
Alternativas
Q2571758 Banco de Dados
O programa Power BI Desktop disponibiliza diversos visuais para representação de variáveis. A figura abaixo ilustra a quantidade de focos de incêndio registrados em 2020, em vários estados do Brasil.

Q95.png (402×250)


Assinale a opção que corresponde ao visual utilizado para representar essa variável.
Alternativas
Q2571759 Banco de Dados
Com relação aos bancos de dados NoSQL orientados a documentos, avalie se as afirmativas a seguir são verdadeiras (V) ou falsas (F).
( ) Utilizam um modelo de dados flexível, e permitem o armazenado de dados em formatos como JSON e BSON. ( ) São comumente mais escaláveis verticalmente do que bancos de dados relacionais, permitindo dessa forma a distribuição de dados entre múltiplos servidores. ( ) Nesse tipo de banco de dados, a normalização dos dados é frequentemente utilizada para melhorar a consistência dos dados e evitar redundância.
As afirmativas são, respectivamente,
Alternativas
Q2571760 Banco de Dados
Sobre banco de dado NoSQL orientado a grafos, avalie se as afirmativas a seguir são falsas (F) ou verdadeiras (V).
I. Se compararmos com um banco de dados relacional, os nós de um grafo correspondem às colunas de uma tabela. II. As operações de junção nesse tipo de banco são frequentemente mais eficientes do que em bancos de dados relacionais, pois utilizam chaves estrangeiras para realizar o relacionamento entre os nós. III. Diferentemente dos outros tipos de banco de dados NoSQL, bancos orientados a grafos não são próprios para se trabalhar com um grande volume de dados.
As afirmativas são, respectivamente,
Alternativas
Q2571761 Banco de Dados
A equipe de TI do TCE-PA está implementando o ElasticSearch para melhorar a busca e análise de seus dados corporativos.
Para garantir a alta disponibilidade, tolerância a falhas e auxiliar na performance durante a busca dos dados, a organização deve configurar
Alternativas
Q2571762 Banco de Dados
Com relação aos conceitos de dado, informação e conhecimento, avalie as afirmativas a seguir.
I. Os dados são itens elementares, são cadeias de símbolos e não possuem significado. II. São exemplos de conhecimento: tendência de vendas de um produto A em uma região B; relação entre o aumento ou queda do preço de uma ação X, na bolsa de valores, e a variação do câmbio. III. As informações correspondem ao dado processado, com significado e um contexto indefinido.
Está correto o que se afirma em
Alternativas
Q2571763 Banco de Dados
Considere o Sistema de Concursos de uma empresa hipotética que adota um Sistema de Gerenciamento de Banco de Dados (SGDB) relacional.
A primeira tabela construída no banco foi Tabela_Candidato, que possui os seguintes campos:
candidato_ID; candidato_Nome; candidato_CPF.
A segunda tabela construída foi a Tabela_Concurso, que possui os seguintes campos:
concurso_ID; candidato_ID; concurso_Nome; concurso_Cargo.
No contexto dos bancos de dados relacionais, é correto afirmar que
Alternativas
Respostas
81: B
82: C
83: D
84: E
85: D
86: E
87: C
88: E
89: D
90: A
91: E
92: D
93: B
94: C
95: C
96: C
97: E
98: D
99: C
100: E