Questões TJ-AC 2024 para Analista Judiciário - Analista de Ciência de Dados

Q2457916

Ano: 2024 Banca: IV - UFG Órgão: TJ-AC Prova: CS-UFG - 2024 - TJ-AC - Analista Judiciário - Analista de Ciência de Dados |

Q2457916 Algoritmos e Estrutura de Dados

Random Forest são algoritmos de aprendizado de máquina utilizados para classificação ou regressão, sendo vantajoso em relação às árvores de decisão no caso de

A

custo computacional reduzido.

B

conjunto de dados com propensão a overfitting.

C

conjunto de dados reduzido.

D

número elevado de classes.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2457917

Ano: 2024 Banca: IV - UFG Órgão: TJ-AC Prova: CS-UFG - 2024 - TJ-AC - Analista Judiciário - Analista de Ciência de Dados |

Q2457917 Algoritmos e Estrutura de Dados

O pré-processamento é um conjunto de atividades que envolvem preparação, organização e estruturação de dados, sendo fundamental no desempenho do modelo de aprendizagem de máquina. Tais atividades contemplam métodos e técnicas de limpeza, transformação, integração e redução de dimensionalidade. Os métodos que podem ser utilizados para o tratamento de dados faltantes são:

A

interpolação de vizinhos mais próximos, valor médio do atributo, valor modal.

B

validação estratificada, k-fold, divisão do conjunto de dados.

C

validação cruzada, leave-one-out (deixando um de fora), valor mediano do atributo.

D

divisão do conjunto de dados, gradiente descendente, valor médio do atributo.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2457918

Ano: 2024 Banca: IV - UFG Órgão: TJ-AC Prova: CS-UFG - 2024 - TJ-AC - Analista Judiciário - Analista de Ciência de Dados |

Q2457918 Algoritmos e Estrutura de Dados

A árvore de decisão ilustrada a seguir foi modelada com base nos dados de registros de ocorrência da dengue no estado do Acre nos últimos cinco (5) anos e será utilizada para tomada de decisão acerca da priorização na disponibilização de vacinas.

Imagem associada para resolução da questão

Imagem associada para resolução da questão

Qual é a evidência de que esse modelo foi construído usando o algoritmo C4.5 ou suas variantes, e não usando o ID3?

A

o tipo dos atributos “idade” e “IMC”.

B

a diferença entre a profundidade mínima e a máxima da árvore.

C

a árvore não é binária.

D

a quantidade de atributos.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2457919

Ano: 2024 Banca: IV - UFG Órgão: TJ-AC Prova: CS-UFG - 2024 - TJ-AC - Analista Judiciário - Analista de Ciência de Dados |

Q2457919 Algoritmos e Estrutura de Dados

Para reduzir a dimensionalidade de um conjunto de dados bidimensionais, foi executado o algoritmo PCA (do inglês, Principal Component Analysis). Se o PCA produzir como resultado dois autovalores de mesmo valor, significa que

A

as dimensões dos dados não são igualmente importantes e o uso do PCA produziu um excelente resultado, pois as dimensões possuem 100% da informação.

B

as dimensões dos dados são igualmente importantes e o uso do PCA produziu um resultado ruim, pois as dimensões possuem 50% da informação.

C

as dimensões dos dados são igualmente importantes e o uso do PCA produziu um resultado ruim, pois perdeu-se 100% da informação.

D

as dimensões dos dados não são igualmente importantes e o uso do PCA produziu um excelente resultado, pois as dimensões possuem 50% da informação.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2457920

Ano: 2024 Banca: IV - UFG Órgão: TJ-AC Prova: CS-UFG - 2024 - TJ-AC - Analista Judiciário - Analista de Ciência de Dados |

Q2457920 Algoritmos e Estrutura de Dados

PV-DM (do inglês, Paragraph Vector Distributed Memory) é um método de aprendizado de máquina utilizado no processamento de dados textuais. A ideia central é prever uma palavra (de contexto) a partir de um conjunto de palavras amostrado aleatoriamente – palavras de contexto e ID de parágrafo. Quando aplicado sobre um conjunto de documentos textuais (por exemplo, os processos deferidos arquivados no TJ-AC), qual a vantagem desse método em relação ao método BOW, baseado em contagem de palavras?

A

Ter menor custo computacional.

B

Resultar em vetores mais compactos.

C

Considerar a ordem das palavras.

D

Ter maior expressividade dos vetores.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2457921

Ano: 2024 Banca: IV - UFG Órgão: TJ-AC Prova: CS-UFG - 2024 - TJ-AC - Analista Judiciário - Analista de Ciência de Dados |

Q2457921 Algoritmos e Estrutura de Dados

Considere a sentença a seguir.

s: “O acesso ao auditório também pode ser feito através de uma rampa”

Aplicando a função f à sentença, obtém-se o seguinte resultado:

f(s) = “acesso auditório pode ser feito através rampa”

A tarefa de tratamento de dados textuais realizada pela função f é:

A

filtragem de conectivos.

B

lematização.

C

remoção de ruído.

D

filtragem de stop words.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2457922

Ano: 2024 Banca: IV - UFG Órgão: TJ-AC Prova: CS-UFG - 2024 - TJ-AC - Analista Judiciário - Analista de Ciência de Dados |

Q2457922 Algoritmos e Estrutura de Dados

No processo de otimização de redes neurais artificiais, diferentes métodos e técnicas são utilizados para determinar os melhores parâmetros do aprendizado. Para reduzir o overfitting, uma das técnicas amplamente utilizadas é a regularização, que apresenta como características:

A

adição de um termo que maximiza a função de custo e menor generalização.

B

redução dos pesos e maior resistência a ruídos no treinamento.

C

aumento dos pesos e maior generalização por redução dos vieses.

D

redução dos pesos e menor generalização no aprendizado.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2457923

Ano: 2024 Banca: IV - UFG Órgão: TJ-AC Prova: CS-UFG - 2024 - TJ-AC - Analista Judiciário - Analista de Ciência de Dados |

Q2457923 Banco de Dados

As características inerentes ao Big Data implicam a necessidade de um sistema de armazenamento, gerenciamento e análise que seja flexível, de forma a se adaptar facilmente aos dados sem comprometer o desempenho. Dentre as soluções, o Data Warehouse (DW) tem como características:

A

garantia da redundância de dados, assegurando cópias de segurança e recuperação em tempo real.

B

armazenamento e análise de dados oriundos de múltiplas fontes e sob diferentes aspectos ou perspectivas.

C

priorização de transações de alta velocidade e operações de atualização, sem suporte a consultas complexas.

D

otimização do espaço de armazenamento, por meio da remoção de dados históricos e priorização de dados operacionais de curto prazo.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2457924

Ano: 2024 Banca: IV - UFG Órgão: TJ-AC Prova: CS-UFG - 2024 - TJ-AC - Analista Judiciário - Analista de Ciência de Dados |

Q2457924 Banco de Dados

A ferramenta de projeto utilizada para apoiar a implementação incremental de modelos dimensionais de áreas de negócio distintos compartilhando dimensões padronizadas em um Data Warehouse Corporativo é:

A

Data Lake.

B

Pipeline de dados.

C

Regras de Associação.

D

Matriz de Barramento.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2457925

Ano: 2024 Banca: IV - UFG Órgão: TJ-AC Prova: CS-UFG - 2024 - TJ-AC - Analista Judiciário - Analista de Ciência de Dados |

Q2457925 Algoritmos e Estrutura de Dados

Para implementar inovações no processo de decisão de sentenças judiciais, um analista do TJ-AC decidiu pelo uso da Tradução Automática Neural (do inglês, Neural Machine Translation - NMT) após comparar diferentes técnicas de Processamento de Linguagem Natural (PLN). As vantagens dessa técnica em relação à Tradução Automática Estatística (do inglês, Statistic Machine Translation - SMT) são:

A

os modelos NMT são mais efetivamente modularizáveis que os SMT e possuem menos parâmetros totais.

B

os parâmetros do modelo NMT são ajustados independentemente, e o processo pode ser escalonado com o aumento da memória disponível.

C

os parâmetros do modelo NMT são ajustados conjuntamente e o processo pode ser paralelizado.

D

os modelos NMT são mais interpretáveis que os modelos SMT e o processo pode ser escalonado com o aumento da memória disponível.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2457926

Ano: 2024 Banca: IV - UFG Órgão: TJ-AC Prova: CS-UFG - 2024 - TJ-AC - Analista Judiciário - Analista de Ciência de Dados |

Q2457926 Algoritmos e Estrutura de Dados

Redes neurais recorrentes (RNNs) são modelos de aprendizado profundo treinados para reconhecer padrões em dados sequenciais (texto, imagens, genomas, caligrafia, palavra falada ou dados de séries numéricas), em que componentes se inter-relacionam com base em regras complexas de semântica e sintaxe. São características das redes neurais recorrentes:

A

ausência de camadas ocultas, o que permite que seu funcionamento seja mais interpretável que as demais topologias.

B

dependência temporal com os dados, uma vez que processam suas próprias saídas como entradas momento após momento.

C

dependência espacial com os dados, uma vez que as entradas são de tamanho fixo.

D

similaridade com a arquitetura feedforward, pelo loop de feedback conectado às suas decisões anteriores, duplicando assim a quantidade de camadas.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2457927

Ano: 2024 Banca: IV - UFG Órgão: TJ-AC Prova: CS-UFG - 2024 - TJ-AC - Analista Judiciário - Analista de Ciência de Dados |

Q2457927 Algoritmos e Estrutura de Dados

A multicolinearidade ocorre quando duas ou mais variáveis independentes encontram-se altamente correlacionadas, causando instabilidade na estimação dos parâmetros e pode comprometer a interpretação dos modelos de regressão. Uma técnica alternativa para lidar com a multicolinearidade é a

A

análise de componentes principais.

B

regressão logística.

C

análise multivariada.

D

função não linear.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2457928

Ano: 2024 Banca: IV - UFG Órgão: TJ-AC Prova: CS-UFG - 2024 - TJ-AC - Analista Judiciário - Analista de Ciência de Dados |

Q2457928 Algoritmos e Estrutura de Dados

Os algoritmos de agrupamento buscam identificar padrões existentes em conjuntos de dados, podendo ser do tipo particionais, hierárquicos ou baseados na otimização da função custo. É um exemplo de agrupamento hierárquico:

A

k-means.

B

análise de componentes principais.

C

aglomerativo.

D

dendrograma.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2457929

Ano: 2024 Banca: IV - UFG Órgão: TJ-AC Prova: CS-UFG - 2024 - TJ-AC - Analista Judiciário - Analista de Ciência de Dados |

Q2457929 Algoritmos e Estrutura de Dados

O Processamento de Linguagem Natural (PLN) é a área da inteligência artificial que analisa, reconhece e/ou gera textos em linguagens humanas (ou natural). Para processar dados textuais, é necessário primeiramente transformá-los em valores numéricos, sendo utilizados algoritmos do tipo word embeddings, tais como glove, tf-idf, word2vector e bag of words (BOW). São características do algoritmo word2vector:

A

representação das palavras em um espaço vetorial de frequência de ocorrência, sem considerar a ordem que aparecem no texto.

B

criação de um espaço de contagem baseado na relevância dos termos, considerando o contexto.

C

atribuição de valor semântico às palavras de acordo com a posição que elas possuem no corpus textual, representando-as num espaço vetorial.

D

criação de um espaço de contagem a partir da distribuição de frequência de ocorrência das palavras, considerando a ordem de ocorrência no texto.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2457930

Ano: 2024 Banca: IV - UFG Órgão: TJ-AC Prova: CS-UFG - 2024 - TJ-AC - Analista Judiciário - Analista de Ciência de Dados |

Q2457930 Algoritmos e Estrutura de Dados

O LDA (do inglês, Latent Dirichlet Allocation) é um modelo de aprendizado não supervisionado e estatístico utilizado no Processamento de Linguagem Natural (PLN). No processo de treinamento, o modelo LDA gera tópicos, sendo que cada tópico incorpora uma quantidade de palavras. Sob a mesma lógica, o resultado da aplicação do LDA sobre um conjunto de documentos textuais pode ser resumido como:

A

uma lista de tópicos, sendo cada um composto pelas palavras mais relevantes do conjunto de documentos, em termos de frequência de ocorrência.

B

um tópico por documento, sendo cada tópico formado pelas palavras mais frequentes do documento.

C

uma distribuição de probabilidade para cada documento, que indica o pertencimento do mesmo a algum dos tópicos, sendo cada tópico é formado por uma lista de palavras.

D

uma distribuição de probabilidade para cada documento, que indica a pertinência do mesmo a algum dos tópicos e onde cada tópico é formado por uma distribuição de probabilidade das palavras presentes nos documentos.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2457931

Ano: 2024 Banca: IV - UFG Órgão: TJ-AC Prova: CS-UFG - 2024 - TJ-AC - Analista Judiciário - Analista de Ciência de Dados |

Q2457931 Algoritmos e Estrutura de Dados

O gráfico a seguir apresenta o comportamento de uma rede neural artificial:

Imagem associada para resolução da questão

Considerando que o modelo foi validado como insatisfatório, as duas técnicas que podem contornar o problema apresentado são:

A

parada precoce, minimização de entropia cruzada.

B

validação cruzada, dropout.

C

sobreamostragem, gradiente descendente estocástico.

D

dropout, parada em convergência.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2457932

Ano: 2024 Banca: IV - UFG Órgão: TJ-AC Prova: CS-UFG - 2024 - TJ-AC - Analista Judiciário - Analista de Ciência de Dados |

Q2457932 Algoritmos e Estrutura de Dados

Uma Rede Neural Convolucional (do inglês, Convolutional Neural Network - CNN) é um algoritmo de aprendizado de máquina profundo que pode, a partir dos dados de entrada, atribuir importância (pesos e vieses que podem ser aprendidos) a vários aspectos dos dados e, portanto, obter maior diferenciação. São características da arquitetura das redes neurais convolucionais:

A

as camadas de convolução realizam extração de características e as camadas de pooling reduzem a dimensionalidade.

B

as camadas de convolução aplicam dropout para ajustar o formato dos dados para serem processados pelas camadas de pooling.

C

as camadas de pooling são baseadas em word embeddings dinâmicos, sendo adequadas para processar dados textuais.

D

as camadas de pooling realizam o fine-tunning para minimizar a função de perda, que mede a diferença entre as previsões do modelo e os rótulos corretos.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2457933

Ano: 2024 Banca: IV - UFG Órgão: TJ-AC Prova: CS-UFG - 2024 - TJ-AC - Analista Judiciário - Analista de Ciência de Dados |

Q2457933 Algoritmos e Estrutura de Dados

Máquinas de vetores de suporte (do inglês, Support Vector Machine - SVM) são algoritmos de aprendizado de máquina que possibilitam a implementação de classificadores. Os modelos implementados a partir desses algoritmos utilizam funções kernel, conferindo como vantagem:

A

ausência da necessidade de pré-processamento.

B

minimização da margem entre as classes.

C

aumento do grau de especialização no aprendizado.

D

capacidade de lidar com dados não lineares.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2457934

Ano: 2024 Banca: IV - UFG Órgão: TJ-AC Prova: CS-UFG - 2024 - TJ-AC - Analista Judiciário - Analista de Ciência de Dados |

Q2457934 Algoritmos e Estrutura de Dados

Ao construir um classificador usando aprendizado de máquina, um analista deve verificar o quão efetivo ele é para a predição, ou seja, estimar sua precisão preditiva, uma vez que o erro é inerente ao processo – deseja-se aprender sobre uma população, mas se tem acesso a uma amostra dela. No caso da classificação, o conjunto de treinamento é utilizado para aprender e um conjunto de testes é utilizado para estimar o erro. Para estimar a precisão preditiva de um classificador a partir de uma amostra de dados não utilizada anteriormente ou não conhecida, podem ser empregadas as seguintes estratégias:

A

leave-p-out, validação cruzada k-fold.

B

matriz de probabilidades, subamostragem aleatória.

C

troca de valores mais frequentes, divisão do conjunto de teste.

D

retirada de dados ausente, tabela de variância.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2457935

Ano: 2024 Banca: IV - UFG Órgão: TJ-AC Prova: CS-UFG - 2024 - TJ-AC - Analista Judiciário - Analista de Ciência de Dados |

Q2457935 Banco de Dados

À medida que as organizações começaram a utilizar múltiplos repositórios ou bancos de dados para armazenar diferentes tipos de informações de negócios, a necessidade de integrar os dados cresceu rapidamente e ETL tornou-se o método padrão utilizado na construção de Data Warehouse (DW). As ferramentas ETL em um Data Warehouse (DW) possuem a função de:

A

definir as regras de negócio para que os filtros sejam aplicados sobre dados heterogêneos.

B

fazer a extração, limpeza e reformatação dos dados, para que estes possam ser carregados no DW.

C

estabelecer regras de filtragem multidimensional dos dados, gerando visões específicas de acordo com as regras de negócio.

D

gerar metadados que poderão alimentar ferramentas de data minning, OLAP e Big Data.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Quer um estudo ilimitado?

Quer um estudo ilimitado?

Questões de Concurso Público TJ-AC 2024 para Analista Judiciário - Analista de Ciência de Dados

Foram encontradas 60 questões