Questões TJ-AC 2024 para Analista Judiciário - Analista de Ciência de Dados

Q2457909

Ano: 2024 Banca: IV - UFG Órgão: TJ-AC Prova: CS-UFG - 2024 - TJ-AC - Analista Judiciário - Analista de Ciência de Dados |

Q2457909 Algoritmos e Estrutura de Dados

O ecossistema Hadoop se refere aos vários componentes da biblioteca de software Apache Hadoop, incluindo projetos de código aberto e ferramentas complementares para armazenar e processar Big Data. Algumas das ferramentas mais conhecidas incluem HDFS, Pig, YARN, MapReduce, Spark, HBase Oozie, Sqoop e Kafka, cada uma com função específica no ecossistema Hadoop. São funções dos componentes do ecossistema Hadoop:

A

HDFS gerencia o armazenamento e o MapReduce gerencia o processamento de dados.

B

Spark é uma ferramenta para o armazenamento, desenvolvido para substituir o HDFS.

C

Kafka é uma ferramenta para processamento de dados distribuídos, em substituição ao processamento em lote.

D

HDFS gerencia o processamento e o MapReduce gerencia o armazenamento de dados.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2457910

Ano: 2024 Banca: IV - UFG Órgão: TJ-AC Prova: CS-UFG - 2024 - TJ-AC - Analista Judiciário - Analista de Ciência de Dados |

Q2457910 Algoritmos e Estrutura de Dados

Para classificar os processos tramitados no TJ-AC em duas categorias (deferidos e indeferidos), um analista escolheu um algoritmo que divide os dados de entrada em duas regiões separadas por uma linha e resulta em uma simetria na classificação, de forma que o ponto mais próximo de cada classe está a uma distância d do ponto médio entre os dois grupos de classe (hiperplano). O algoritmo descrito é denominado:

A

regressão linear.

B

k-vizinhos mais próximos.

C

máquina de vetores de suporte.

D

regressão logística.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2457911

Ano: 2024 Banca: IV - UFG Órgão: TJ-AC Prova: CS-UFG - 2024 - TJ-AC - Analista Judiciário - Analista de Ciência de Dados |

Q2457911 Algoritmos e Estrutura de Dados

Observe o gráfico a seguir.

Imagem associada para resolução da questão

Disponível em: <http://cursos.leg.ufpr.br/ML4all/apoio/reamostragem.html>. Acesso em: mar. 2024.

O gráfico representa as regiões de overfitting e underfitting, permitindo uma avaliação do relacionamento da complexidade do modelo de aprendizagem de máquina com o erro de predição. A partir do exposto no gráfico, o erro de generalização do modelo ocorre na região:

A

entre as duas curvas, na região à esquerda do ponto A.

B

sobre o ponto A.

C

entre as duas curvas, na região indicada pela letra B.

D

acima do ponto A.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2457912

Ano: 2024 Banca: IV - UFG Órgão: TJ-AC Prova: CS-UFG - 2024 - TJ-AC - Analista Judiciário - Analista de Ciência de Dados |

Q2457912 Algoritmos e Estrutura de Dados

Seja a matriz de confusão obtida na avaliação de desempenho de um modelo de aprendizado treinado para classificar processos julgados pelo TJ-AC:

Imagem associada para resolução da questão

Os valores da performance geral, da sensibilidade e da precisão do modelo são, respectivamente:

A

0,40; 0,30; 1,30.

B

0,40; 0,67; 0,93.

C

0,85; 0,20; 0,93.

D

0,85; 0,67; 0,80.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2457913

Ano: 2024 Banca: IV - UFG Órgão: TJ-AC Prova: CS-UFG - 2024 - TJ-AC - Analista Judiciário - Analista de Ciência de Dados |

Q2457913 Algoritmos e Estrutura de Dados

Uma das métricas mais comumente utilizadas para comparar resultados de algoritmos de clusterização é obtida por meio da fórmula (b-a)/ max(a,b), em que:
a é a distância média entre os pontos dentro de cada cluster (distância média intra-cluster) e
b é a distância média para o cluster mais próximo (distância média para os pontos do cluster mais próximo).

A métrica descrita recebe o nome de:

A

R².

B

silhouette score.

C

F1-score.

D

ROC.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2457914

Ano: 2024 Banca: IV - UFG Órgão: TJ-AC Prova: CS-UFG - 2024 - TJ-AC - Analista Judiciário - Analista de Ciência de Dados |

Q2457914 Algoritmos e Estrutura de Dados

Uma rede neural foi implementada a partir da arquitetura Multilayer Perceptron (MLP) e o conjunto de dados foi dividido em holdout com 50% para conjunto de treinamento, 30% para conjunto de validação e 20% para conjunto de teste. Se, durante o treinamento e a validação da referida rede ocorreu underfitting, dois fatores que podem ter condicionado tal fenômeno são:

A

insuficiência de parâmetros e excesso de camadas.

B

excesso de parâmetros e excesso de iterações.

C

iterações insuficientes e amostragem dos dados.

D

excesso de iterações e entrada não normalizada.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2457915

Ano: 2024 Banca: IV - UFG Órgão: TJ-AC Prova: CS-UFG - 2024 - TJ-AC - Analista Judiciário - Analista de Ciência de Dados |

Q2457915 Algoritmos e Estrutura de Dados

A camada de uma rede convolucional que tem como função primária reduzir progressivamente o tamanho espacial do volume de dados de entrada por meio do mapeamento de seções de features e diminuição dos pesos de treinamento é denominada camada de

A

convolução.

B

ativação.

C

pooling.

D

normalização.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2457916

Ano: 2024 Banca: IV - UFG Órgão: TJ-AC Prova: CS-UFG - 2024 - TJ-AC - Analista Judiciário - Analista de Ciência de Dados |

Q2457916 Algoritmos e Estrutura de Dados

Random Forest são algoritmos de aprendizado de máquina utilizados para classificação ou regressão, sendo vantajoso em relação às árvores de decisão no caso de

A

custo computacional reduzido.

B

conjunto de dados com propensão a overfitting.

C

conjunto de dados reduzido.

D

número elevado de classes.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2457917

Ano: 2024 Banca: IV - UFG Órgão: TJ-AC Prova: CS-UFG - 2024 - TJ-AC - Analista Judiciário - Analista de Ciência de Dados |

Q2457917 Algoritmos e Estrutura de Dados

O pré-processamento é um conjunto de atividades que envolvem preparação, organização e estruturação de dados, sendo fundamental no desempenho do modelo de aprendizagem de máquina. Tais atividades contemplam métodos e técnicas de limpeza, transformação, integração e redução de dimensionalidade. Os métodos que podem ser utilizados para o tratamento de dados faltantes são:

A

interpolação de vizinhos mais próximos, valor médio do atributo, valor modal.

B

validação estratificada, k-fold, divisão do conjunto de dados.

C

validação cruzada, leave-one-out (deixando um de fora), valor mediano do atributo.

D

divisão do conjunto de dados, gradiente descendente, valor médio do atributo.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2457918

Ano: 2024 Banca: IV - UFG Órgão: TJ-AC Prova: CS-UFG - 2024 - TJ-AC - Analista Judiciário - Analista de Ciência de Dados |

Q2457918 Algoritmos e Estrutura de Dados

A árvore de decisão ilustrada a seguir foi modelada com base nos dados de registros de ocorrência da dengue no estado do Acre nos últimos cinco (5) anos e será utilizada para tomada de decisão acerca da priorização na disponibilização de vacinas.

Imagem associada para resolução da questão

Qual é a evidência de que esse modelo foi construído usando o algoritmo C4.5 ou suas variantes, e não usando o ID3?

A

o tipo dos atributos “idade” e “IMC”.

B

a diferença entre a profundidade mínima e a máxima da árvore.

C

a árvore não é binária.

D

a quantidade de atributos.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2457919

Ano: 2024 Banca: IV - UFG Órgão: TJ-AC Prova: CS-UFG - 2024 - TJ-AC - Analista Judiciário - Analista de Ciência de Dados |

Q2457919 Algoritmos e Estrutura de Dados

Para reduzir a dimensionalidade de um conjunto de dados bidimensionais, foi executado o algoritmo PCA (do inglês, Principal Component Analysis). Se o PCA produzir como resultado dois autovalores de mesmo valor, significa que

A

as dimensões dos dados não são igualmente importantes e o uso do PCA produziu um excelente resultado, pois as dimensões possuem 100% da informação.

B

as dimensões dos dados são igualmente importantes e o uso do PCA produziu um resultado ruim, pois as dimensões possuem 50% da informação.

C

as dimensões dos dados são igualmente importantes e o uso do PCA produziu um resultado ruim, pois perdeu-se 100% da informação.

D

as dimensões dos dados não são igualmente importantes e o uso do PCA produziu um excelente resultado, pois as dimensões possuem 50% da informação.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2457920

Ano: 2024 Banca: IV - UFG Órgão: TJ-AC Prova: CS-UFG - 2024 - TJ-AC - Analista Judiciário - Analista de Ciência de Dados |

Q2457920 Algoritmos e Estrutura de Dados

PV-DM (do inglês, Paragraph Vector Distributed Memory) é um método de aprendizado de máquina utilizado no processamento de dados textuais. A ideia central é prever uma palavra (de contexto) a partir de um conjunto de palavras amostrado aleatoriamente – palavras de contexto e ID de parágrafo. Quando aplicado sobre um conjunto de documentos textuais (por exemplo, os processos deferidos arquivados no TJ-AC), qual a vantagem desse método em relação ao método BOW, baseado em contagem de palavras?

A

Ter menor custo computacional.

B

Resultar em vetores mais compactos.

C

Considerar a ordem das palavras.

D

Ter maior expressividade dos vetores.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2457921

Ano: 2024 Banca: IV - UFG Órgão: TJ-AC Prova: CS-UFG - 2024 - TJ-AC - Analista Judiciário - Analista de Ciência de Dados |

Q2457921 Algoritmos e Estrutura de Dados

Considere a sentença a seguir.

s: “O acesso ao auditório também pode ser feito através de uma rampa”

Aplicando a função f à sentença, obtém-se o seguinte resultado:

f(s) = “acesso auditório pode ser feito através rampa”

A tarefa de tratamento de dados textuais realizada pela função f é:

A

filtragem de conectivos.

B

lematização.

C

remoção de ruído.

D

filtragem de stop words.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2457922

Ano: 2024 Banca: IV - UFG Órgão: TJ-AC Prova: CS-UFG - 2024 - TJ-AC - Analista Judiciário - Analista de Ciência de Dados |

Q2457922 Algoritmos e Estrutura de Dados

No processo de otimização de redes neurais artificiais, diferentes métodos e técnicas são utilizados para determinar os melhores parâmetros do aprendizado. Para reduzir o overfitting, uma das técnicas amplamente utilizadas é a regularização, que apresenta como características:

A

adição de um termo que maximiza a função de custo e menor generalização.

B

redução dos pesos e maior resistência a ruídos no treinamento.

C

aumento dos pesos e maior generalização por redução dos vieses.

D

redução dos pesos e menor generalização no aprendizado.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2457925

Ano: 2024 Banca: IV - UFG Órgão: TJ-AC Prova: CS-UFG - 2024 - TJ-AC - Analista Judiciário - Analista de Ciência de Dados |

Q2457925 Algoritmos e Estrutura de Dados

Para implementar inovações no processo de decisão de sentenças judiciais, um analista do TJ-AC decidiu pelo uso da Tradução Automática Neural (do inglês, Neural Machine Translation - NMT) após comparar diferentes técnicas de Processamento de Linguagem Natural (PLN). As vantagens dessa técnica em relação à Tradução Automática Estatística (do inglês, Statistic Machine Translation - SMT) são:

A

os modelos NMT são mais efetivamente modularizáveis que os SMT e possuem menos parâmetros totais.

B

os parâmetros do modelo NMT são ajustados independentemente, e o processo pode ser escalonado com o aumento da memória disponível.

C

os parâmetros do modelo NMT são ajustados conjuntamente e o processo pode ser paralelizado.

D

os modelos NMT são mais interpretáveis que os modelos SMT e o processo pode ser escalonado com o aumento da memória disponível.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2457926

Ano: 2024 Banca: IV - UFG Órgão: TJ-AC Prova: CS-UFG - 2024 - TJ-AC - Analista Judiciário - Analista de Ciência de Dados |

Q2457926 Algoritmos e Estrutura de Dados

Redes neurais recorrentes (RNNs) são modelos de aprendizado profundo treinados para reconhecer padrões em dados sequenciais (texto, imagens, genomas, caligrafia, palavra falada ou dados de séries numéricas), em que componentes se inter-relacionam com base em regras complexas de semântica e sintaxe. São características das redes neurais recorrentes:

A

ausência de camadas ocultas, o que permite que seu funcionamento seja mais interpretável que as demais topologias.

B

dependência temporal com os dados, uma vez que processam suas próprias saídas como entradas momento após momento.

C

dependência espacial com os dados, uma vez que as entradas são de tamanho fixo.

D

similaridade com a arquitetura feedforward, pelo loop de feedback conectado às suas decisões anteriores, duplicando assim a quantidade de camadas.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2457927

Ano: 2024 Banca: IV - UFG Órgão: TJ-AC Prova: CS-UFG - 2024 - TJ-AC - Analista Judiciário - Analista de Ciência de Dados |

Q2457927 Algoritmos e Estrutura de Dados

A multicolinearidade ocorre quando duas ou mais variáveis independentes encontram-se altamente correlacionadas, causando instabilidade na estimação dos parâmetros e pode comprometer a interpretação dos modelos de regressão. Uma técnica alternativa para lidar com a multicolinearidade é a

A

análise de componentes principais.

B

regressão logística.

C

análise multivariada.

D

função não linear.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2457928

Ano: 2024 Banca: IV - UFG Órgão: TJ-AC Prova: CS-UFG - 2024 - TJ-AC - Analista Judiciário - Analista de Ciência de Dados |

Q2457928 Algoritmos e Estrutura de Dados

Os algoritmos de agrupamento buscam identificar padrões existentes em conjuntos de dados, podendo ser do tipo particionais, hierárquicos ou baseados na otimização da função custo. É um exemplo de agrupamento hierárquico:

A

k-means.

B

análise de componentes principais.

C

aglomerativo.

D

dendrograma.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2457929

Ano: 2024 Banca: IV - UFG Órgão: TJ-AC Prova: CS-UFG - 2024 - TJ-AC - Analista Judiciário - Analista de Ciência de Dados |

Q2457929 Algoritmos e Estrutura de Dados

O Processamento de Linguagem Natural (PLN) é a área da inteligência artificial que analisa, reconhece e/ou gera textos em linguagens humanas (ou natural). Para processar dados textuais, é necessário primeiramente transformá-los em valores numéricos, sendo utilizados algoritmos do tipo word embeddings, tais como glove, tf-idf, word2vector e bag of words (BOW). São características do algoritmo word2vector:

A

representação das palavras em um espaço vetorial de frequência de ocorrência, sem considerar a ordem que aparecem no texto.

B

criação de um espaço de contagem baseado na relevância dos termos, considerando o contexto.

C

atribuição de valor semântico às palavras de acordo com a posição que elas possuem no corpus textual, representando-as num espaço vetorial.

D

criação de um espaço de contagem a partir da distribuição de frequência de ocorrência das palavras, considerando a ordem de ocorrência no texto.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2457930

Ano: 2024 Banca: IV - UFG Órgão: TJ-AC Prova: CS-UFG - 2024 - TJ-AC - Analista Judiciário - Analista de Ciência de Dados |

Q2457930 Algoritmos e Estrutura de Dados

O LDA (do inglês, Latent Dirichlet Allocation) é um modelo de aprendizado não supervisionado e estatístico utilizado no Processamento de Linguagem Natural (PLN). No processo de treinamento, o modelo LDA gera tópicos, sendo que cada tópico incorpora uma quantidade de palavras. Sob a mesma lógica, o resultado da aplicação do LDA sobre um conjunto de documentos textuais pode ser resumido como:

A

uma lista de tópicos, sendo cada um composto pelas palavras mais relevantes do conjunto de documentos, em termos de frequência de ocorrência.

B

um tópico por documento, sendo cada tópico formado pelas palavras mais frequentes do documento.

C

uma distribuição de probabilidade para cada documento, que indica o pertencimento do mesmo a algum dos tópicos, sendo cada tópico é formado por uma lista de palavras.

D

uma distribuição de probabilidade para cada documento, que indica a pertinência do mesmo a algum dos tópicos e onde cada tópico é formado por uma distribuição de probabilidade das palavras presentes nos documentos.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Quer um estudo ilimitado?

Quer um estudo ilimitado?

Questões de Concurso Público TJ-AC 2024 para Analista Judiciário - Analista de Ciência de Dados

Foram encontradas 24 questões