Questões de Concurso
Para fgv
Foram encontradas 111.116 questões
Resolva questões gratuitamente!
Junte-se a mais de 4 milhões de concurseiros!
I. O uso de algoritmos baseados no teorema de Bayes pode ser aplicado quando os dados disponíveis estão incompletos ou imprecisos.
II. O classificador naive Bayes assume a hipótese de que os valores dos atributos de um exemplo são dependentes de sua classe.
III. As redes bayesianas utilizam o conceito de independência condicional entre variáveis.
Está correto o que se afirma em
Acerca das bibliotecas NumPy, pandas e SciPy, analise as afirmativas a seguir, e assinale V para a afirmativa verdadeira e F para a falsa.
( ) A biblioteca NumPy é baseada na manipulação de estruturas de dados multidimensionais, nas quais todos os elementos possuem o mesmo tipo.
( ) A biblioteca pandas possui métodos próprios para geração e visualização de gráficos.
( ) A biblioteca SciPy possui um pacote para manipulação de matrizes esparsas.
As afirmativas são, respectivamente
I. A fase inicial do projeto é especificar as necessidades de dados dos prováveis usuários do sistema, através de descrições textuais e gráficas.
II. O projeto conceitual traduz as necessidades dos usuários para um esquema conceitual, como por exemplo o modelo entidade-relacionamento. Bem como, nesta fase, é elaborado uma especificação das necessidades funcionais (os usuários descrevem os tipos de operações que serão realizadas sobre os dados.
III. O projeto lógico mapeia o esquema conceitual de alto nível para um modelo físico do sistema de banco de dados, como definição de tabela e seus relacionamentos.
IV. Na fase do projeto físico, o projetista especifica os recursos físicos do esquema resultante do modelo lógico. Esses recursos incluem a forma de organização do arquivo e as estruturas de armazenamento internas.
Está correto o que se afirma em
Assim, sobre falha e recuperação em banco de dados, as afirmativas a seguir estão corretas, à exceção de uma. Assinale-a.
I O algoritmo k-NN classifica os pontos com base nas distâncias entre eles e seus k vizinhos mais próximos.
II O valor de k deve ser escolhido aleatoriamente e não tem impacto no desempenho do modelo k-NN.
III O algoritmo k-NN é sensível à escala das variáveis de entrada e geralmente requer normalização dos dados antes de ser aplicado.
É correto o que se afirma em

Os valores de w1, w2 e T são, respectivamente
1 import numpy as np 2 from scipy.stats import pearsonr 3 np.random.seed(110) 4 s1 = np.random.normal(size=1000) 5 s2 = s1.copy() 6 s2[0] = 100.0 7 print(pearsonr(s1,s2))
Ao ser executado o código acima, após a linha 7 foi escrito na tela o seguinte:
PearsonRResult(statistic=0.3104130838548752, pvalue=8.891269104323198e-24)
Acerca do exposto, analise os itens a seguir.
I. Os valores possíveis para ‘statistic’ estão no intervalo entre 0 e 1.
II. Os valores da mediana de s1 e de s2 são os mesmos.
III. O resultado da linha 7 escrito na tela indica que ‘s1’ e ‘s2’ possuem uma fraca relação linear.
Está correto o que se afirma em
( ) O erro médio quadrático é uma métrica típica de erro em problemas de regressão cujo valor varia entre 0 e 1.
( ) Pode-se afirmar que o conjunto de dados C1 está melhor ajustado ao modelo do que o conjunto de dados C2.
( ) Pode-se afirmar que para melhorar o ajuste do conjunto de dados C2 é preciso aumentar seu tamanho.
As afirmativas são, respectivamente,
I. A soma de todos os elementos da matriz é igual a n.
II. A taxa de acerto do classificador é dada pela razão entre a soma da diagonal principal da matriz e a soma de todos os elementos.
III. A precisão do classificador para certa classe i é dada pela razão entre o elemento da diagonal principal na linha i e a soma de todos os elementos da coluna i.
Está correto o que se afirma em
Sobre o Power BI, assinale a afirmativa correta:
Sobre regras de associação, assinale a afirmativa correta.
Os itens a seguir contém alguns exemplos de dados que podem se enquadrar dentro dessas três definições.
I. Um banco de dados relacional.
II. Grafos que representam relações de usuários em uma rede social.
III. Um e-mail, que contém texto, imagens e um campo destinado a informar a data e a hora onde foi enviado.
O(s) item(s) que contém dados do tipo não estruturado é(são):
Dessa maneira, relacione os principais problemas que podem ser solucionados pelo tratamento de dados com as suas respectivas definições.
1. Enviesamento 2. Ruídos 3. Inconsistência 4. Redundância
( ) Ocorre quando existem alguns desvios dos valores verdadeiros, em geral por imprecisões existentes nos dispositivos que realizam a coleta dos dados.
( ) Ocorre quando dados repetem informações já presentes no conjunto obtido.
( ) Ocorre quando os dados não reproduzem bem a situação a ser analisada e produzem um modelo frequentemente preconceituoso.
( ) Ocorre quando atributos de dados são preenchidos de maneira incorreta, seja por engano ou com intenções fraudulentas, por exemplo.
Assinale a opção que indica a relação correta na ordem apresentada.
Com relação aos sistemas de Inteligência de Negócios (BI) e suas finalidades, assinale V para a afirmativa verdadeira e F para a falsa.
( ) Dashboards são interfaces para manipulação de dados que possibilitam exibições visuais detalhadas, utilizadas com frequência por gestores de empresas por sua capacidade de agrupamento de informações em uma mesma tela.
( ) Armazéns de dados (Data Warehouses) não podem ser hospedados, ou seja, desenvolvidos e mantidos por uma empresa terceira, devido a preocupações com a segurança e com o sigilo dos dados, que toda empresa deve possuir.
( ) Um dos objetivos do BI em uma empresa é proporcionar a transformação de dados em informações, que podem contribuir para a tomada de decisões estratégicas pelos líderes e gestores de uma instituição.
As afirmativas são, respectivamente:
Sobre os fundamentos da Ciência de Dados, assinale a alternativa que contém a afirmação correta.