Questões de Concurso Público DATAPREV 2024 para ATI - Inteligência da Informação

Foram encontradas 70 questões

Q3086082 Não definido
Os modelos de dados desempenham um papel fundamental no processo de ETL (Extração, Transformação e Carga), pois são responsáveis por estruturar e organizar as informações de maneira eficiente e consistente. Eles garantem que os dados extraídos de diferentes fontes sejam integrados corretamente, facilitando a transformação e preparação para a análise posterior.
No contexto de modelos de dados em ETL, existe o conceito de tabela de fatos sem fato (factless fact), que se caracteriza por
Alternativas
Q3086083 Não definido
Seja o conjunto de dados X apresentado a seguir, em que os atributos “P” e “Q” são preditores, e o atributo “Classe” é o atributo-alvo:

Q62.png (255×118)

Queremos classificar uma nova amostra x=(5.0, 5.0) utilizando o algoritmo clássico dos k vizinhos mais próximos (k-NN), utilizando a distância euclidiana para a determinação de vizinhanças.
Com base nesse algoritmo, e considerando os valores aproximados de √2 ≈ 1,414 e √3 ≈ 2,236, o k-NN retorna como categoria de x
Alternativas
Q3086084 Não definido

Considere o código Python abaixo, que utiliza as bibliotecas Pandas e Matplotlib:


Q63.png (307×131)


Com base no código fornecido, assinale a opção que descreve corretamente a sua função.

Alternativas
Q3086085 Não definido
Considere o seguinte código que tenta criar e treinar uma rede neural simples com TensorFlow e Keras. Observe o erro que pode ocorrer ao tentar executá-lo (desconsidere questões de indentação do Pythone):
Q64.png (333×145)

Com base no código, assinale a opção que indica o erro que levaria a uma falha na execução.
Alternativas
Q3086086 Não definido

Considere o seguinte código em R:


Q65.png (317×137)



É correto afirmar que

Alternativas
Q3086087 Não definido
O Apache Hadoop é uma plataforma amplamente utilizada no processamento de grandes volumes de dados. Ele se destaca por sua arquitetura distribuída e capacidade de lidar com grandes conjuntos de dados de forma eficiente.
Com base nas capacidades e funcionalidades do Hadoop, assinale a opção que = descreve corretamente seu funcionamento e aplicação prática.
Alternativas
Q3086088 Não definido
O Apache Spark é uma ferramenta amplamente utilizada para processamento de grandes volumes de dados.
Assinale a opção que o descreve corretamente, assim como suas capacidades e suas funcionalidades.
Alternativas
Q3086089 Não definido
Um dos conceitos associados a coleções de objetos de dados e/ou arquivos de sistemas de bancos de dados NoSQL é o de sharding.
Nesse contexto, uma das características de sharding refere-se
Alternativas
Q3086090 Não definido
No âmbito de normalização de bancos de dados relacionais, há o conceito de dependência com a seguinte especificação: “para o esquema de uma relação R, uma restrição que demanda que cada estado r de R apresente uma decomposição de junção não aditiva e não trivial para cada decomposição Ri de R, em que o valor de i varie entre 1 e n, sendo n o número de decomposições de R”.
Esse conceito de dependência, considerando um valor de n maior que dois (n>2), integra a definição da 
Alternativas
Q3086091 Não definido
Em um sistema de banco de dados relacional, o script de comandos SQL a seguir especificado foi submetido à execução:
Q70.png (283×218)

A análise do script permite-nos afirmar que a sua execução produzirá um resultado.
Assinale a opção que indica esse resultado. 
Alternativas
Respostas
31: B
32: B
33: A
34: B
35: E
36: B
37: B
38: E
39: D
40: A