Questões de Concurso
Sobre r em programação
Foram encontradas 101 questões
• ID: identificador único do processo.
• Status: status do processo (“em andamento”, “finalizado” ou “arquivado”).
• Numero Decisoes: número de decisões ou despachos no processo.
• Data Conclusao: data de conclusão do processo (se o status for “finalizado”), no formato AAAA-MM-DD.
Nesse contexto, considere que um analista deseja calcular a soma total de decisões ou despachos proferidas nos processos “finalizados” para cada ano de conclusão. Qual das alternativa a seguir realiza essa operação corretamente, utilizando funções dplyr, e salva o resultado no objeto Soma_Decisoes?
modelo <- lm(indenizacao ~ litigio + testemunhas, data = dados)
summary(modelo)
vif(modelo)
plot(modelo)
Com base no código descrito, assinale a afirmativa INCORRETA.
O pacote dplyr do software R traz uma sintaxe intuitiva e eficiente para manipulação de dados, permitindo a filtragem, transformação, agrupamento e resumo de grandes conjuntos de dados de forma concisa e rápida. Considere uma base de dados (armazenada no objeto dados) que contém informações sobre processos judiciais e possui as seguintes variáveis:
• ID: identificador único do processo;
• Data_Abertura: data em que o processo foi iniciado;
• Status: status do processo (“Em andamento”, “Finalizado” ou “Arquivado”); e
• Valor_Controversia: valor monetário em disputa no processo.
Com base nesse contexto, considere o interesse de encontrar o número total de processos que têm valor de controvérsia superior a R$ 1.000.000,00 em cada um dos três tipos de status possíveis. Se esse resultado for armazenado no objeto Total_Controversia, qual das alternativas a seguir faz essa operação com funções do dplyr?
( ) No Oracle R Enterprise, a execução do R incorporado (ou Embedded R) possibilita a chamada de scripts do R em sessões do R executadas no servidor do Oracle Database.
( ) A interoperabilidade entre Python e R pode ser estabelecida pelo pacote reticulate do R, que possibilita que no código R sejam utilizadas ambas as abordagens, em documentos R Markdown e no IDE RStudio.
( ) Os principais pacotes para manipulação de dados são o dplyr, para o R, e o Scikit-learn, para o Python.
As afirmativas são, respectivamente,
Em R, o operador %in%
Considere o seguinte código em R:
É correto afirmar que
Seja o código em R a seguir:
Analisando o código apresentado, sem a necessidade de executá-lo, é correto deduzir que
Um profissional de dados está analisando um conjunto de
dados com informações sobre as vendas de produtos em
diferentes regiões ao longo do tempo. Seu objetivo é visualizar a
tendência das vendas para cada região de forma clara e
comparativa. Para isso, ele decidiu utilizar o em R.
Com base nessa situação hipotética, assinale a opção que
apresenta o código que, se executado, gerará um gráfico de linhas
que mostra a tendência de vendas ao longo do tempo para cada
região, utilizando cores diferentes para cada região.
A respeito da linguagem R, é correto afirmar que
Uma das limitações do pacote neuralnet é não oferecer ao usuário muitas opções pré-definidas de funções de ativação. Caso o usuário deseje utilizar uma função de ativação diferente das únicas duas já pré-definidas no pacote, é preciso definí-la e atribuí-la por meio do argumento act.fct.
Ao invocar o método neuralnet para o treinamento de uma rede neural, caso o argumento act.fct não seja explicitamente determinado na chamada do método, a função de ativação padrão utilizada nos neurônios da rede será
Assinale a opção que indica o conjunto de funções auxiliares desse pacote que são muito úteis para a seleção de colunas.
Sobre as diferenças entre essas duas ferramentas, analise as afirmativas a seguir.
I. Python possui um padrão mais bem definido, permitindo que diferentes tipos de funcionalidades sejam escritos da mesma forma, enquanto no R, a mesma funcionalidade pode ser escrita de diversas formas diferentes.
II. Python é principalmente usada quando a análise de dados precisa ser integrada com aplicativos web ou se o código estatístico precisa ser integrado em um servidor em ambiente de produção, que vai servir muitos usuários, enquanto o R é principalmente usado quando as atividades de análise de dados requerem computação standalone (em um único computador) ou análise em servidores individuais.
III. Tanto o Python quanto o R foram criados inicialmente para análise de dados.
Está correto o que se afirma em
Para uma Analista ler dados de um arquivo CSV chamado amostras.csv e armazená-los em um dataframe chamado dados, utilizando a linguagem R, ele deve utilizar o comando