Questões SEBRAE-NACIONAL 2024 para Analista Técnico II – Cientista de Dados

Q3015567

Ano: 2024 Banca: CESPE / CEBRASPE Órgão: SEBRAE-NACIONAL Prova: CESPE / CEBRASPE - 2024 - SEBRAE-NACIONAL - Analista Técnico II – Cientista de Dados |

Q3015567 Estatística

Um modelo de regressão linear múltipla com dez coeficientes foi ajustado pelo método de mínimos quadrados ordinários, tendo produzido um coeficiente de determinação (R²) igual a 80%.

Nessa hipótese, caso o tamanho da amostra utilizado para esse ajuste tenha sido igual a 46, então o valor correspondente do coeficiente conhecido como “R² ajustado” deve ter sido igual a

A

0,68.

B

0,72.

C

0,75.

D

0,80.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q3015568

Ano: 2024 Banca: CESPE / CEBRASPE Órgão: SEBRAE-NACIONAL Prova: CESPE / CEBRASPE - 2024 - SEBRAE-NACIONAL - Analista Técnico II – Cientista de Dados |

Q3015568 Estatística

Supondo-se que a variável aleatória X possa assumir valores 0, 1, 2 ou 3 conforme a função de distribuição de probabilidade P(X = h) = Imagem associada para resolução da questão na qual h ∈ {0, 1, 2, 3}, é correto afirmar que o valor esperado de X seja igual a

A

2,4.

B

0,6.

C

1,2.

D

1,5.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q3015569

Ano: 2024 Banca: CESPE / CEBRASPE Órgão: SEBRAE-NACIONAL Prova: CESPE / CEBRASPE - 2024 - SEBRAE-NACIONAL - Analista Técnico II – Cientista de Dados |

Q3015569 Estatística

Se N for uma variável aleatória que siga uma distribuição normal com média igual a 10 e desvio padrão igual a 5 e se Z = Imagem associada para resolução da questão , então a probabilidade de ocorrência do evento “Z = 1,96” será igual a

A

0.

B

0,025.

C

0,5.

D

0,975.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q3015570

Ano: 2024 Banca: CESPE / CEBRASPE Órgão: SEBRAE-NACIONAL Prova: CESPE / CEBRASPE - 2024 - SEBRAE-NACIONAL - Analista Técnico II – Cientista de Dados |

Q3015570 Estatística

O conjunto de dados {0, 4, 3, 3, 0} é uma realização de uma amostra aleatória simples retirada de uma população binomial com parâmetros n e p, sendo n = 4 e p uma probabilidade desconhecida.

Com base nessas informações, é correto afirmar que a estimativa de máxima verossimilhança para a probabilidade de ocorrência do valor 2 na população em questão é igual a

A

0.

B

0,0625.

C

0,20.

D

0,375.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q3015571

Ano: 2024 Banca: CESPE / CEBRASPE Órgão: SEBRAE-NACIONAL Prova: CESPE / CEBRASPE - 2024 - SEBRAE-NACIONAL - Analista Técnico II – Cientista de Dados |

Q3015571 Estatística

10 ± 4 representa a estimativa intervalar de 95% de confiança para a média de uma população normal, tendo sido obtida a partir de uma amostra aleatória de tamanho n . Para a obtenção dessa estimativa, considerou-se que a variância populacional fosse conhecida. Em novo levantamento feito sobre essa mesma população, mas, dessa vez, tendo-se quadruplicado o tamanho da amostra (4n), foi obtida média amostral igual a 8.

Nesse caso, se 8 ± ε representar a nova estimativa intervalar de 95% de confiança para a média dessa população, é correto afirmar que ε deverá ser igual a

A

0,5.

B

1.

C

2.

D

2,5.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q3015572

Ano: 2024 Banca: CESPE / CEBRASPE Órgão: SEBRAE-NACIONAL Prova: CESPE / CEBRASPE - 2024 - SEBRAE-NACIONAL - Analista Técnico II – Cientista de Dados |

Q3015572 Programação

O seguinte código Python utiliza o algoritmo KNN (k-nearest neighbors) para classificação, em que o parâmetro Imagem associada para resolução da questão define o número de vizinhos que o classificador KNN irá considerar para realizar a previsão.

Com base no código precedente, é correto afirmar que, caso o valor de Imagem associada para resolução da questão fosse alterado de 3 para 4, o modelo

A

não seria capaz de classificar novos pontos de dados e retornaria

B

poderia resultar em empates mais frequentes, levando a previsões que dependam mais do critério de desempate do algoritmo.

C

consideraria todos os pontos de treinamento para qualquer nova previsão, o que levaria a resultados mais precisos.

D

poderia fornecer previsões mais sensíveis a mudanças pequenas no dado, com menos probabilidade de empate.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q3015573

Ano: 2024 Banca: CESPE / CEBRASPE Órgão: SEBRAE-NACIONAL Prova: CESPE / CEBRASPE - 2024 - SEBRAE-NACIONAL - Analista Técnico II – Cientista de Dados |

Q3015573 Algoritmos e Estrutura de Dados

Imagem associada para resolução da questão

Considerando a figura precedente, assinale a opção correta em relação ao algoritmo de SVM (support vector machine).

A

Uma margem mais ampla geralmente indica um melhor desempenho na classificação, pois sugere que o modelo tem uma separação mais clara entre as classes.

B

O hiperplano ilustrado na figura é caracterizado por um plano, pois estão sendo considerados dois recursos de entrada x₁ e x₂.

C

Uma escolha razoável como melhor hiperplano é aquele que representa a menor separação ou margem entre as duas classes.

D

O hiperplano de margem suave separa perfeitamente os pontos de diferentes classes, sem erros de classificação e com uma margem fixa.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q3015574

Ano: 2024 Banca: CESPE / CEBRASPE Órgão: SEBRAE-NACIONAL Prova: CESPE / CEBRASPE - 2024 - SEBRAE-NACIONAL - Analista Técnico II – Cientista de Dados |

Q3015574 Algoritmos e Estrutura de Dados

Em aprendizado de máquina, especialmente em algoritmos de árvores de decisão, é fundamental avaliar como os dados são organizados e classificados em diferentes níveis da árvore. Três conceitos-chave que auxiliam na construção e otimização dessas árvores são o gini impurity, a entropy e o information gain. A respeito desses conceitos, julgue os itens a seguir.

I Gini impurity mede a redução da entropy após a divisão de um conjunto de dados com base em um atributo.

II Entropy mede a quantidade de incerteza ou impureza no conjunto de dados.

III Information gain mede a probabilidade de uma nova instância ser classificada incorretamente, com base na distribuição de classes no conjunto de dados.

Assinale a opção correta.

A

Apenas o item II está certo.

B

Apenas o item III está certo.

C

Apenas os itens I e II estão certos.

D

Apenas os itens I e III estão certos.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q3015575

Ano: 2024 Banca: CESPE / CEBRASPE Órgão: SEBRAE-NACIONAL Prova: CESPE / CEBRASPE - 2024 - SEBRAE-NACIONAL - Analista Técnico II – Cientista de Dados |

Q3015575 Algoritmos e Estrutura de Dados

A respeito dos diferentes tipos de algoritmos naive Bayes, assinale a opção correta.

A

No multinomial naive Bayes a média e a variância dos atributos são estimadas para cada classe a partir dos dados de treinamento.

B

O bernoulli naive Bayes representa as frequências com as quais certos eventos foram gerados por uma distribuição normal.

C

Os feature vectors do Bernoulli naive Bayes são geralmente contagens de eventos ou frequências.

D

No gaussian naive Bayes, assume-se que os valores contínuos associados a cada recurso são distribuídos de acordo com uma distribuição normal.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q3015576

Ano: 2024 Banca: CESPE / CEBRASPE Órgão: SEBRAE-NACIONAL Prova: CESPE / CEBRASPE - 2024 - SEBRAE-NACIONAL - Analista Técnico II – Cientista de Dados |

Q3015576 Algoritmos e Estrutura de Dados

Assinale a opção em que é apresentado exemplo no qual o uso prático do gaussian naive Bayes é mais apropriado.

A

classificação de flores com base em características como comprimento e largura das pétalas, em que os atributos são contínuos

B

detecção de fraudes em transações bancárias, utilizando-se apenas indicadores binários de eventos suspeitos

C

classificação de documentos com base na frequência de palavras em textos

D

análise de sentimentos em redes sociais, onde os dados de entrada são contagens de palavras positivas e negativas

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q3015577

Ano: 2024 Banca: CESPE / CEBRASPE Órgão: SEBRAE-NACIONAL Prova: CESPE / CEBRASPE - 2024 - SEBRAE-NACIONAL - Analista Técnico II – Cientista de Dados |

Q3015577 Algoritmos e Estrutura de Dados

Em relação aos conceitos do algoritmo k-means, julgue os itens a seguir.

I É importante continuar as iterações do algoritmo k-means até que a mudança na posição dos centroides entre as iterações seja menor que um limite predefinido.

II No coeficiente de silhueta, quanto mais próximo o coeficiente estiver de 1, menor a distância entre os clusters; 0 indica que os dados podem estar no cluster errado; valores negativos sugerem que o ponto está na borda.

III Apesar de um maior número clusters sempre reduzir o SSE (sum of squared errors), isso não significa que mais clusters sempre sejam melhores, pois um número muito grande de clusters pode levar a overfitting do modelo.

Assinale a opção correta.

A

Apenas o item I está certo.

B

Apenas o item II está certo.

C

Apenas os itens I e III estão certos.

D

Apenas os itens II e III estão certos.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q3015578

Ano: 2024 Banca: CESPE / CEBRASPE Órgão: SEBRAE-NACIONAL Prova: CESPE / CEBRASPE - 2024 - SEBRAE-NACIONAL - Analista Técnico II – Cientista de Dados |

Q3015578 Programação

A respeito da linguagem R, é correto afirmar que

A

a função em R é usada para realizar regressão linear.

B

o operador é utilizado para atribuir valores a variáveis.

C

a função cria tabelas de frequência.

D

o operador é utilizado para definir novas variáveis em R.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q3015579

Ano: 2024 Banca: CESPE / CEBRASPE Órgão: SEBRAE-NACIONAL Prova: CESPE / CEBRASPE - 2024 - SEBRAE-NACIONAL - Analista Técnico II – Cientista de Dados |

Q3015579 Programação

Imagem associada para resolução da questão

Considerando o código precedente, escrito em Python, assinale a opção que corresponde à sua correta execução.

A

B

C

D

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q3015580

Ano: 2024 Banca: CESPE / CEBRASPE Órgão: SEBRAE-NACIONAL Prova: CESPE / CEBRASPE - 2024 - SEBRAE-NACIONAL - Analista Técnico II – Cientista de Dados |

Q3015580 Programação

Imagem associada para resolução da questão

Assinale a opção que corresponde à correta execução do código precedente, escrito em Python.

A

B

C

D

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q3015581

Ano: 2024 Banca: CESPE / CEBRASPE Órgão: SEBRAE-NACIONAL Prova: CESPE / CEBRASPE - 2024 - SEBRAE-NACIONAL - Analista Técnico II – Cientista de Dados |

Q3015581 Programação

Assinale a opção correta a respeito da implantação de um modelo de classificação de árvore de decisão em Python.

A

Para treinar um modelo, deve-se utilizar o método , em que a variável representa os rótulos verdadeiros, e as características dos dados.

B

Após treinar o modelo por meio do comando , o método deve ser utilizado para avaliar o desempenho do modelo com novos dados de teste.

C

O método é utilizado para avaliar o desempenho do modelo de árvore de decisão aos dados de treinamento.

D

Após treinar o modelo por meio do comando , deve-se utilizar para realizar previsões em novos dados de teste.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q3015582

Ano: 2024 Banca: CESPE / CEBRASPE Órgão: SEBRAE-NACIONAL Prova: CESPE / CEBRASPE - 2024 - SEBRAE-NACIONAL - Analista Técnico II – Cientista de Dados |

Q3015582 Banco de Dados

Caso um cientista de dados precise extrair, transformar e analisar grandes volumes de dados em um banco de dados relacional, usando SQL, a prática mais recomendável para garantir que as operações de análise sejam eficientes e precisas consiste em

A

aplicar funções de agregação como , e com cláusulas para resumir e agregar os dados de forma eficiente.

B

ignorar o uso de índices ao executar consultas, já que a criação e a manutenção de índices são responsabilidades do administrador do banco de dados.

C

usar comandos * em todas as consultas para garantir que todas as colunas sejam retornadas, facilitando a análise posterior.

D

utilizar subconsultas (subqueries) complexas em vez de operações de junção para simplificar a lógica das consultas.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q3015583

Ano: 2024 Banca: CESPE / CEBRASPE Órgão: SEBRAE-NACIONAL Prova: CESPE / CEBRASPE - 2024 - SEBRAE-NACIONAL - Analista Técnico II – Cientista de Dados |

Q3015583 Banco de Dados

Texto associado

Texto 14A3

Em certa base de dados de e-commerce, as tabelas e possuem as seguintes estruturas:

Um cientista de dados precisa analisar o comportamento de compra dos clientes na base de dados descrita no texto 14A3. O objetivo dessa análise é calcular o valor total gasto por cliente em pedidos feitos no mês anterior ao atual.

Com base nessa situação hipotética, assinale a opção em que consta o comando que executará corretamente o cálculo requerido.

A

B

C

D

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q3015584

Ano: 2024 Banca: CESPE / CEBRASPE Órgão: SEBRAE-NACIONAL Prova: CESPE / CEBRASPE - 2024 - SEBRAE-NACIONAL - Analista Técnico II – Cientista de Dados |

Q3015584 Banco de Dados

Texto associado

Texto 14A3

Em certa base de dados de e-commerce, as tabelas e possuem as seguintes estruturas:

Assinale a opção em que é indicada a consulta SQL que, na base de dados descrita no texto 14A3, retorna o nome dos clientes e o valor total de seus pedidos, apenas para aqueles que tenham realizado mais de 5 pedidos no ano de 2023.

A

B

C

D

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q3015585

Ano: 2024 Banca: CESPE / CEBRASPE Órgão: SEBRAE-NACIONAL Prova: CESPE / CEBRASPE - 2024 - SEBRAE-NACIONAL - Analista Técnico II – Cientista de Dados |

Q3015585 Banco de Dados

Um analista está criando um dashboard no Power BI para visualizar as vendas mensais de uma empresa e necessita criar uma medida que calcule a média móvel de 3 meses de vendas.

Nessa situação, a fórmula DAX mais adequada para a tarefa mencionada é

A

B

C

D

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q3015586

Ano: 2024 Banca: CESPE / CEBRASPE Órgão: SEBRAE-NACIONAL Prova: CESPE / CEBRASPE - 2024 - SEBRAE-NACIONAL - Analista Técnico II – Cientista de Dados |

Q3015586 Banco de Dados

A respeito das semelhanças e diferenças entre o Power BI e o Qlik Sense na construção de dashboards, assinale a opção correta.

A

O Qlik Sense permite a criação de relatórios paginados nativamente, enquanto o Power BI requer o uso de uma ferramenta adicional para essa funcionalidade.

B

O Power BI permite a criação de dashboards interativos, enquanto o Qlik Sense não oferece essa funcionalidade.

C

O Power BI possui uma integração mais robusta com o Microsoft Excel, enquanto o Qlik Sense é mais conhecido por sua capacidade de associar dados de diferentes fontes de forma automática.

D

O Qlik Sense utiliza a mesma linguagem que o Power BI para a criação de medidas e cálculos.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

SEJA VITALÍCIO

SEJA VITALÍCIO

Questões de Concurso Público SEBRAE-NACIONAL 2024 para Analista Técnico II – Cientista de Dados

Foram encontradas 50 questões