Questões de Concurso Público TJ-AC 2024 para Analista Judiciário - Analista de Ciência de Dados

Foram encontradas 60 questões

Q2457916 Algoritmos e Estrutura de Dados
Random Forest são algoritmos de aprendizado de máquina utilizados para classificação ou regressão, sendo vantajoso em relação às árvores de decisão no caso de
Alternativas
Q2457917 Algoritmos e Estrutura de Dados
O pré-processamento é um conjunto de atividades que envolvem preparação, organização e estruturação de dados, sendo fundamental no desempenho do modelo de aprendizagem de máquina. Tais atividades contemplam métodos e técnicas de limpeza, transformação, integração e redução de dimensionalidade. Os métodos que podem ser utilizados para o tratamento de dados faltantes são:
Alternativas
Q2457918 Algoritmos e Estrutura de Dados
A árvore de decisão ilustrada a seguir foi modelada com base nos dados de registros de ocorrência da dengue no estado do Acre nos últimos cinco (5) anos e será utilizada para tomada de decisão acerca da priorização na disponibilização de vacinas.

Imagem associada para resolução da questão


Qual é a evidência de que esse modelo foi construído usando o algoritmo C4.5 ou suas variantes, e não usando o ID3?
Alternativas
Q2457919 Algoritmos e Estrutura de Dados
Para reduzir a dimensionalidade de um conjunto de dados bidimensionais, foi executado o algoritmo PCA (do inglês, Principal Component Analysis). Se o PCA produzir como resultado dois autovalores de mesmo valor, significa que
Alternativas
Q2457920 Algoritmos e Estrutura de Dados
PV-DM (do inglês, Paragraph Vector Distributed Memory) é um método de aprendizado de máquina utilizado no processamento de dados textuais. A ideia central é prever uma palavra (de contexto) a partir de um conjunto de palavras amostrado aleatoriamente – palavras de contexto e ID de parágrafo. Quando aplicado sobre um conjunto de documentos textuais (por exemplo, os processos deferidos arquivados no TJ-AC), qual a vantagem desse método em relação ao método BOW, baseado em contagem de palavras? 
Alternativas
Q2457921 Algoritmos e Estrutura de Dados
Considere a sentença a seguir.

s:O acesso ao auditório também pode ser feito através de uma rampa

Aplicando a função f à sentença, obtém-se o seguinte resultado:

f(s) =acesso auditório pode ser feito através rampa

A tarefa de tratamento de dados textuais realizada pela função f é:
Alternativas
Q2457922 Algoritmos e Estrutura de Dados
No processo de otimização de redes neurais artificiais, diferentes métodos e técnicas são utilizados para determinar os melhores parâmetros do aprendizado. Para reduzir o overfitting, uma das técnicas amplamente utilizadas é a regularização, que apresenta como características: 
Alternativas
Q2457923 Banco de Dados
As características inerentes ao Big Data implicam a necessidade de um sistema de armazenamento, gerenciamento e análise que seja flexível, de forma a se adaptar facilmente aos dados sem comprometer o desempenho. Dentre as soluções, o Data Warehouse (DW) tem como características: 
Alternativas
Q2457924 Banco de Dados
A ferramenta de projeto utilizada para apoiar a implementação incremental de modelos dimensionais de áreas de negócio distintos compartilhando dimensões padronizadas em um Data Warehouse Corporativo é:
Alternativas
Q2457925 Algoritmos e Estrutura de Dados
Para implementar inovações no processo de decisão de sentenças judiciais, um analista do TJ-AC decidiu pelo uso da Tradução Automática Neural (do inglês, Neural Machine Translation - NMT) após comparar diferentes técnicas de Processamento de Linguagem Natural (PLN). As vantagens dessa técnica em relação à Tradução Automática Estatística (do inglês, Statistic Machine Translation - SMT) são:
Alternativas
Q2457926 Algoritmos e Estrutura de Dados
Redes neurais recorrentes (RNNs) são modelos de aprendizado profundo treinados para reconhecer padrões em dados sequenciais (texto, imagens, genomas, caligrafia, palavra falada ou dados de séries numéricas), em que componentes se inter-relacionam com base em regras complexas de semântica e sintaxe. São características das redes neurais recorrentes:
Alternativas
Q2457927 Algoritmos e Estrutura de Dados
A multicolinearidade ocorre quando duas ou mais variáveis independentes encontram-se altamente correlacionadas, causando instabilidade na estimação dos parâmetros e pode comprometer a interpretação dos modelos de regressão. Uma técnica alternativa para lidar com a multicolinearidade é a
Alternativas
Q2457928 Algoritmos e Estrutura de Dados
Os algoritmos de agrupamento buscam identificar padrões existentes em conjuntos de dados, podendo ser do tipo particionais, hierárquicos ou baseados na otimização da função custo. É um exemplo de agrupamento hierárquico:
Alternativas
Q2457929 Algoritmos e Estrutura de Dados
O Processamento de Linguagem Natural (PLN) é a área da inteligência artificial que analisa, reconhece e/ou gera textos em linguagens humanas (ou natural). Para processar dados textuais, é necessário primeiramente transformá-los em valores numéricos, sendo utilizados algoritmos do tipo word embeddings, tais como glove, tf-idf, word2vector e bag of words (BOW). São características do algoritmo word2vector:
Alternativas
Q2457930 Algoritmos e Estrutura de Dados
O LDA (do inglês, Latent Dirichlet Allocation) é um modelo de aprendizado não supervisionado e estatístico utilizado no Processamento de Linguagem Natural (PLN). No processo de treinamento, o modelo LDA gera tópicos, sendo que cada tópico incorpora uma quantidade de palavras. Sob a mesma lógica, o resultado da aplicação do LDA sobre um conjunto de documentos textuais pode ser resumido como:
Alternativas
Q2457931 Algoritmos e Estrutura de Dados
O gráfico a seguir apresenta o comportamento de uma rede neural artificial:

Imagem associada para resolução da questão


Considerando que o modelo foi validado como insatisfatório, as duas técnicas que podem contornar o problema apresentado são:
Alternativas
Q2457932 Algoritmos e Estrutura de Dados
Uma Rede Neural Convolucional (do inglês, Convolutional Neural Network - CNN) é um algoritmo de aprendizado de máquina profundo que pode, a partir dos dados de entrada, atribuir importância (pesos e vieses que podem ser aprendidos) a vários aspectos dos dados e, portanto, obter maior diferenciação. São características da arquitetura das redes neurais convolucionais:
Alternativas
Q2457933 Algoritmos e Estrutura de Dados
Máquinas de vetores de suporte (do inglês, Support Vector Machine - SVM) são algoritmos de aprendizado de máquina que possibilitam a implementação de classificadores. Os modelos implementados a partir desses algoritmos utilizam funções kernel, conferindo como vantagem:
Alternativas
Q2457934 Algoritmos e Estrutura de Dados
Ao construir um classificador usando aprendizado de máquina, um analista deve verificar o quão efetivo ele é para a predição, ou seja, estimar sua precisão preditiva, uma vez que o erro é inerente ao processo – deseja-se aprender sobre uma população, mas se tem acesso a uma amostra dela. No caso da classificação, o conjunto de treinamento é utilizado para aprender e um conjunto de testes é utilizado para estimar o erro. Para estimar a precisão preditiva de um classificador a partir de uma amostra de dados não utilizada anteriormente ou não conhecida, podem ser empregadas as seguintes estratégias:
Alternativas
Q2457935 Banco de Dados
À medida que as organizações começaram a utilizar múltiplos repositórios ou bancos de dados para armazenar diferentes tipos de informações de negócios, a necessidade de integrar os dados cresceu rapidamente e ETL tornou-se o método padrão utilizado na construção de Data Warehouse (DW). As ferramentas ETL em um Data Warehouse (DW) possuem a função de:
Alternativas
Respostas
41: B
42: A
43: A
44: C
45: C
46: D
47: B
48: B
49: D
50: C
51: B
52: A
53: C
54: C
55: D
56: B
57: A
58: D
59: A
60: B