Questões de Concurso

Foram encontradas 2.420 questões

Resolva questões gratuitamente!

Junte-se a mais de 4 milhões de concurseiros!

Q2517650 Banco de Dados
Os Sistemas Gerenciadores de Banco de Dados (SGBD) comerciais implementam internamente técnicas para processar, otimizar e executar consultas de alto nível.

Uma estratégia eficiente utilizada pelo otimizador de consultas do SGBD considera o uso de:
Alternativas
Q2517646 Banco de Dados
Documentos do Jupyter Notebook são salvos com a extensão .ipynb, mas internamente eles são documentos do tipo:
Alternativas
Q2517644 Banco de Dados
Um cientista de dados utiliza a biblioteca scikit-learn para treinar um estimador clf usando um conjunto de treinamento X1 e seu respectivo conjunto de atributos-alvo y. Posteriormente, o cientista estima os atributos-alvo do conjunto X2.

Para realizar o treinamento e a predição, o cientista de dados deve usar, respectivamente, os métodos:
Alternativas
Q2517641 Banco de Dados
Uma certa organização gostaria de compartilhar dados com um grupo de pesquisadores de uma universidade para a condução de um estudo sobre problemas ergonômicos nos seus escritórios. Entre os dados coletados, há informações sensíveis sobre seus funcionários; portanto, o responsável pela coleta decidiu anonimizar os dados. Isso foi feito removendo-se nomes e outros campos identificadores e adicionando-se um número identificador próprio a cada funcionário. Dessa forma, a identidade dos funcionários seria preservada. Após a verificação de uma amostra, o pesquisador responsável pelo estudo recomendou medidas que deveriam ser aplicadas antes que os dados pudessem ser aceitos para o estudo.

O problema que mais provavelmente motivou a recomendação do pesquisador e uma medida que pode mitigar esse problema são, respectivamente:
Alternativas
Q2517637 Banco de Dados
Ao receber um conjunto de dados para elaborar um modelo preditivo, uma equipe de analistas de dados percebeu que havia uma quantidade significativa de dados faltantes em certos atributos. Foi então debatido o uso de duas técnicas para lidar com esse problema: (1) remoção de observações contendo dados ausentes e (2) “inputação” multivariável, sendo que apenas uma das duas seria aplicada.

Duas características do conjunto de dados que devem ser prioritariamente consideradas na escolha entre as duas técnicas são:
Alternativas
Respostas
16: C
17: C
18: B
19: C
20: E