Questões de Concurso
Foram encontradas 153.781 questões
Resolva questões gratuitamente!
Junte-se a mais de 4 milhões de concurseiros!
Um analista está trabalhando em um projeto sobre o desempenho de micro e pequenas empresas no Brasil. Os dados utilizados no projeto incluem informações como faturamento anual, número de empregados e distribuição geográfica por estado. O objetivo desse projeto é criar visualizações que facilitem a análise dessas informações e identifiquem tendências regionais e setoriais.
Considerando a situação hipotética apresentada e o volume e a complexidade dos dados utilizados, assinale a opção em que é descrita a abordagem mais apropriada para a criação de visualizações eficientes e informativas, utilizando-se em R ou em Python.
Um analista está trabalhando em um projeto que envolve a análise de dados sobre micro e pequenas empresas no Brasil. Seu objetivo é construir um dashboard no Power BI que mostre a evolução dos negócios em diferentes setores, com métricas como faturamento, número de empregados, e taxa de sobrevivência das empresas ao longo dos anos. Os dados estão armazenados em um banco de dados relacional SQL.
Com base nessa situação hipotética, assinale a opção em que é descrita a abordagem mais eficiente para configurar o Power BI, com a utilização de SQL, de forma que o dashboard seja otimizado para desempenho e atualizado regularmente com novos dados.
Assinale a opção que apresenta corretamente a consulta SQL que retornará a média de salários por departamento de uma empresa, considerada uma tabela com colunas
.
Um analista foi encarregado de criar um dashboard que mostre a evolução das vendas trimestrais de uma empresa que utiliza tanto Power BI quanto Qlik Sense e armazena seus dados em um banco de dados SQL. O analista precisa extrair os dados trimestrais de 2023 e criar um dashboard interativo que permita aos usuários filtrar por categoria de produto e região.
Nessa situação hipotética, o referido analista deverá escrever
uma consulta SQL para extrair os dados trimestrais de 2023 e
criar um dashboard no
Texto 14A3
Em certa base de dados de e-commerce, as tabelas e possuem as seguintes estruturas:
Assinale a opção em que é indicada a consulta SQL que, na base
de dados descrita no texto 14A3, retorna o nome dos clientes e o
valor total de seus pedidos, apenas para aqueles que tenham
realizado mais de 5 pedidos no ano de 2023.
Texto 14A3
Em certa base de dados de e-commerce, as tabelas e possuem as seguintes estruturas:
Um cientista de dados precisa analisar o comportamento de compra dos clientes na base de dados descrita no texto 14A3. O objetivo dessa análise é calcular o valor total gasto por cliente em pedidos feitos no mês anterior ao atual.
Com base nessa situação hipotética, assinale a opção em que
consta o comando que executará corretamente o cálculo
requerido.
Assinale a opção correta a respeito da implantação de um modelo
de classificação de árvore de decisão em Python.
Assinale a opção que corresponde à correta execução do código
precedente, escrito em Python.
Considerando o código precedente, escrito em Python, assinale a
opção que corresponde à sua correta execução.
A respeito da linguagem R, é correto afirmar que
Em relação aos conceitos do algoritmo k-means, julgue os itens a seguir.
I É importante continuar as iterações do algoritmo k-means até que a mudança na posição dos centroides entre as iterações seja menor que um limite predefinido.
II No coeficiente de silhueta, quanto mais próximo o coeficiente estiver de 1, menor a distância entre os clusters; 0 indica que os dados podem estar no cluster errado; valores negativos sugerem que o ponto está na borda.
III Apesar de um maior número clusters sempre reduzir o SSE (sum of squared errors), isso não significa que mais clusters sempre sejam melhores, pois um número muito grande de clusters pode levar a overfitting do modelo.
Assinale a opção correta.
Em aprendizado de máquina, especialmente em algoritmos de árvores de decisão, é fundamental avaliar como os dados são organizados e classificados em diferentes níveis da árvore. Três conceitos-chave que auxiliam na construção e otimização dessas árvores são o gini impurity, a entropy e o information gain. A respeito desses conceitos, julgue os itens a seguir.
I Gini impurity mede a redução da entropy após a divisão de um conjunto de dados com base em um atributo.
II Entropy mede a quantidade de incerteza ou impureza no conjunto de dados.
III Information gain mede a probabilidade de uma nova instância ser classificada incorretamente, com base na distribuição de classes no conjunto de dados.
Assinale a opção correta.
Considerando a figura precedente, assinale a opção correta em
relação ao algoritmo de SVM (support vector machine).
Uma característica inerente a discos SSD é a de
As notícias descrevem um ataque cibernético de ransomware, um tipo de malware, que desativou as portas automáticas e as câmeras de segurança do sistema prisional do centro de detenção de Bernalillo, nos Estados Unidos.
A forma de ataque característica de um ransomware é a de