Questões de Engenharia de Software - Inteligencia Artificial para Concurso - Página 5

Q2847411

Ano: 2024 Banca: FGV Órgão: EPE Prova: FGV - 2024 - EPE - Analista de Gestão Corporativa - Tecnologia da Informação (Ciência de Dados) |

Q2847411 Engenharia de Software

As técnicas de aprendizado supervisionado estão baseadas na determinação de modelos capazes de otimizar o mapeamento entre entradas e saídas de um conjunto de dados. Por vezes, o processo de treinamento pode gerar modelos muito complexos que “aprendem” o ruído existente nos conjuntos de dados, caracterizando o fenômeno de sobreajuste ou overfitting.

Um método que pode ajudar a mitigar a ocorrência do overfitting consiste em

I. dividir o conjunto de dados em k partes;
II. utilizar uma das partes para teste e as outras k-1 para treinamento;
III. repetir o processo para cada uma das k partes do conjunto de dados; e
IV. avaliar a média das métricas de performance para o modelo.

O método acima é chamado de

A

k vizinhos mais próximos (k nearest neighbors ou k-NN).

B

retropropagação (backpropagation).

C

validação cruzada (cross-validation).

D

regularização Lasso (Lasso regularization).

E

comitê de modelos (model ensembling).

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2847390

Ano: 2024 Banca: FGV Órgão: EPE Prova: FGV - 2024 - EPE - Analista de Gestão Corporativa - Tecnologia da Informação (Ciência de Dados) |

Q2847390 Engenharia de Software

Há uma família de modelos de IA generativa que tem dois modelos treinados em conjunto: o gerador e o discriminador.
O gerador tenta criar dados falsos que sejam indistinguíveis dos dados reais, enquanto que o discriminador tenta distinguir entre dados reais e falsos. O treinamento é um jogo min-max, em que o gerador melhora suas habilidades para enganar o discriminador, e o discriminador melhora suas habilidades para detectar dados falsos.
Assinale a opção que apresenta as características do modelo de IA generativa descritas no texto.

A

Generative Adversarial Networks.

B

Variational Autoencoders.

C

Energy-Based Models.

D

Autoregressive Models.

E

Normalizing Flow Models.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2746054

Ano: 2015 Banca: IESES Órgão: CRC-SC Prova: IESES - 2015 - CRC-SC - Assistente Jurídico |

Q2746054 Engenharia de Software

Uma linguagem de programação é um conjunto de convenções e regras que especificam como instruir o computador a executar determinadas tarefas. Os sistemas que utilizam mecanismos da área da Inteligência Artificial, como por exemplo, sistemas especialistas são denominados de:

A

Linguagem de montagem.

B

Linguagem orientada ao usuário.

C

Linguagem em nível de máquina.

D

Linguagem do conhecimento.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2745884

Ano: 2024 Banca: FGV Órgão: TCE-PA Prova: FGV - 2024 - TCE-PA - Auditor de Controle Externo - Área de Informática - Web Design |

Q2745884 Engenharia de Software

O uso de Inteligência Artificial generativa é de grande utilidade para desenvolvedores web, por permitir a criação rápida de ilustrações e gráficos de alta qualidade. Por exemplo, uma das ferramentas mais populares atualmente é a aplicação Crayion, anteriormente conhecida como DALL-E mini, por ser uma ferramenta de acesso livre com interface amigável. No entanto, essas ferramentas podem frustrar os usuários por apresentarem limitações que inviabilizam o uso dos elementos visuais criados a partir de seus resultados. A respeito das tendências no uso de IA generativa em design web, avalie as afirmativas a seguir:

I. Há limitações éticas relacionadas à reprodução de potenciais vieses discriminatórios, provenientes das bases de dados de treinamento das redes generativas.
II. Sua principal vantagem consiste na eliminação de elementos de propriedade intelectual protegida nas imagens geradas, garantindo aos desenvolvedores a não-obrigatoriedade de pagamentos de direitos autorais.
III. Há preocupações com relação à geração de imagens extremamente realistas e com o potencial uso dos chamados “deepfakes” em campanhas de desinformação.

Está correto o que se afirma em

A

I, apenas.

B

I e II, apenas.

C

I, II e III.

D

II e III, apenas.

E

I e III, apenas.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2745883

Ano: 2024 Banca: FGV Órgão: TCE-PA Prova: FGV - 2024 - TCE-PA - Auditor de Controle Externo - Área de Informática - Web Design |

Q2745883 Engenharia de Software

Diversas ferramentas de IA generativa têm sido utilizadas em desenvolvimento web, com foco especial na personalização de experiências do usuário. Em geral, a personalização de experiências se baseia no processamento de dados coletados dos usuários.
A respeito dos benefícios relacionados ao uso de técnicas de IA generativa para personalização das experiências dos usuários, avalie as afirmativas a seguir:

I. Os usuários tendem, predominantemente, a se sentir mais valorizados ao receberem conteúdos alinhados a suas preferências e necessidades.
II. Os usuários tendem, predominantemente, a se sentir mais seguros com relação à proteção e à utilização ética e moralmente correta de seus dados privados.
III. Os usuários podem receber conteúdos dinâmicos, mais adequados às configurações de seus dispositivos.

Está correto o que se afirma em

A

I, apenas.

B

II, apenas.

C

III, apenas.

D

I e II, apenas.

E

I e III, apenas.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2705526

Ano: 2024 Banca: FGV Órgão: TCE-PA Prova: FGV - 2024 - TCE-PA - Auditor de Controle Externo - Área de Informática - Analista de Sistemas |

Q2705526 Engenharia de Software

O desenvolvimento de algoritmos de Inteligência Artificial generativa está relacionado a aspectos éticos com impactos sociais, culturais e econômicos. Entre as diretrizes presentes em diversos instrumentos regulatórios relacionados à IA generativa, destaca-se a priorização de abordagens considerando os aspectos que formam a matriz FAT.
O acrônimo FAT é formado pelos seguintes princípios éticos relacionados ao desenvolvimento de algoritmos:

A

Feedback, Algorithm e Training.

B

Framework, Agents e Tasks.

C

Fairness, Accountability e Transparency.

D

Freedom, Autonomy e Trust.

E

Fidelity, Altruism e Truthfulness.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2705525

Ano: 2024 Banca: FGV Órgão: TCE-PA Prova: FGV - 2024 - TCE-PA - Auditor de Controle Externo - Área de Informática - Analista de Sistemas |

Q2705525 Engenharia de Software

O campo da inteligência artificial generativa é dedicado ao desenvolvimento de algoritmos capazes de gerar novas instâncias de dados. Suas aplicações incluem, por exemplo, a criação de textos, imagens, áudio e vídeo. As redes generativas adversárias (Generative Adversarial Networks – GANs) são um exemplo de IA generativa que possuem arquitetura baseada em duas redes, chamadas geradora e discriminadora, que competem entre si.
Um dos principais problemas das GANs ocorre quando a rede geradora produz apenas uma quantidade limitada de tipos de dados, mesmo que seus dados de treinamento sejam mais ricos e diversificados. Isso ocorre porque a rede geradora consegue “enganar” a rede discriminadora mais facilmente quando dados daqueles tipos específicos são produzidos.
A esse fenômeno dá-se o nome de

A

Falha de Convergência (Convergence Failure).

B

Sobreajuste (Overfitting).

C

Colapso de Modo (Mode Collapse).

D

Filtragem Estocástica (Stochastic Filtering).

E

Crescimento de Padrões Frequentes (Frequent Pattern Growth).

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2705524

Ano: 2024 Banca: FGV Órgão: TCE-PA Prova: FGV - 2024 - TCE-PA - Auditor de Controle Externo - Área de Informática - Analista de Sistemas |

Q2705524 Engenharia de Software

Em processamento de linguagem natural (Natural Language Processing - NLP), é fundamental que sejam utilizadas técnicas para representar palavras numericamente como vetores. As representações numéricas são importantes para capturar relações semânticas entre as palavras, permitindo, por exemplo, processamentos para a detecção de similaridades entre palavras e o desenvolvimento de chatbots.
Entre as técnicas de NLP para a representação numérica de palavras destacam-se as seguintes:

A

word2vec e GloVe.

B

stemming e lemmatization.

C

segmentation e efficient embedding.

D

seq2seq e symbolic representation.

E

text-to-speech (TTS) e part-of-speech (POS).

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2705523

Ano: 2024 Banca: FGV Órgão: TCE-PA Prova: FGV - 2024 - TCE-PA - Auditor de Controle Externo - Área de Informática - Analista de Sistemas |

Q2705523 Engenharia de Software

Alguns dos primeiros modelos de linguagem de larga escala desenvolvidos tendiam a gerar resultados incorretos com excesso de confiança, caracterizando o que se convencionou chamar de alucinações dos modelos. Uma estratégia de mitigação das alucinações é o uso da técnica de Geração Aumentada por Recuperação, ou Retrieval-Augmented Generation (RAG).
A respeito da RAG, avalie as afirmativas a seguir.

I. Baseia-se na combinação de sistemas de recuperação de informações e de modelos generativos capazes de produzir novos textos.
II. Permite aos modelos buscarem informações relevantes em bases de dados mais confiáveis durante o processamento das consultas dos usuários (user queries), viabilizando melhor adequação a contextos e melhor qualidade das respostas.
III. Não altera os parâmetros dos modelos generativos, e, portanto, não influencia o treinamento das redes neurais com informações recuperadas de bases de dados externas.

Está correto o que se afirma em

A

I, apenas.

B

II, apenas.

C

III, apenas.

D

I e II, apenas.

E

I, II e III.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2705522

Ano: 2024 Banca: FGV Órgão: TCE-PA Prova: FGV - 2024 - TCE-PA - Auditor de Controle Externo - Área de Informática - Analista de Sistemas |

Q2705522 Engenharia de Software

As arquiteturas de modelos de linguagem de larga escala (Large Language Models – LLM) surgiram recentemente, revolucionando a área de inteligência artificial nas áreas de processamento e geração de texto. A arquitetura desses modelos baseia-se, majoritariamente, nas redes neurais do tipo transformers.
Relacione as arquiteturas a seguir as suas características principais.

1. BERT
2. GPT
3. T5

( ) Utiliza decoders das redes transformer para prever novos tokens a partir de uma sequência, tornando-se ideal para a geração de textos.
( ) Utiliza encoders das redes transformer para "entender" o contexto de frases, tornando-se ideal para classificação de textos.
( ) Utiliza encoders e decoders das redes transformer, sendo adaptável a situações em que seja necessário gerar novos textos ou processar textos para "entender" o contexto das frases.
( ) Em comparação com as outras arquiteturas, tem menor necessidade de fine-tuning para melhora de performance.

A relação correta, na ordem apresentada, é

A

1 – 3 – 2 – 2.

B

2 – 3 – 1 – 3.

C

3 – 2 – 1 – 2.

D

3 – 1 – 2 – 2.

E

2 – 1 – 3 – 3.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2705521

Ano: 2024 Banca: FGV Órgão: TCE-PA Prova: FGV - 2024 - TCE-PA - Auditor de Controle Externo - Área de Informática - Analista de Sistemas |

Q2705521 Engenharia de Software

Alguns algoritmos de aprendizado de máquina servem para agrupar instâncias de dados em clusters, podendo ser utilizados para tarefas como segmentação de imagens, ou segmentação social (por exemplo, para agrupamento de clientes em uma mesma categoria.
Dois dos mais populares algoritmos são o K-means e o DBSCAN. A respeito desses algoritmos, relacione-os com suas principais características:

1. K-means
2. DBSCAN
( ) Precisa da definição de um número inicial de agrupamentos.
( ) Mais robusto à ocorrência de outliers, por sua provável localização em regiões de baixa densidade de dados.
( ) Precisa da definição do número mínimo de vizinhos e do raio da vizinhança para determinar limites dos agrupamentos.
( ) Determina centróides dos agrupamentos e agrupa as instâncias de dados em função de uma métrica de distância entre as instâncias e os centróides.

Das opções a seguir, aquela que indica a relação correta na sequência apresentada é

A

2 – 1 – 2 – 1.

B

1 – 1 – 2 – 1.

C

2 – 1 – 1 – 2.

D

2 – 1 – 1 – 1

E

1 – 2 – 2 – 1.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2705519

Ano: 2024 Banca: FGV Órgão: TCE-PA Prova: FGV - 2024 - TCE-PA - Auditor de Controle Externo - Área de Informática - Analista de Sistemas |

Q2705519 Engenharia de Software

Diferentes técnicas de classificação são utilizadas em aprendizado de máquina para organizar e categorizar dados de acordo com características predefinidas.
Com respeito a técnicas de classificação em aprendizado de máquina, analise as afirmativas a seguir:

I. A regressão logística determina um hiperplano no espaço n- dimensional para separar as instâncias de dados de entrada em partições de acordo com suas classes.
II. As máquinas de vetores de suporte (Support Vector Machines - SVM) consistem em uma abordagem probabilística, determinando uma distribuição de probabilidades de que uma nova instância de dados de entrada pertença as respectivas classes.
III. O algoritmo K vizinhos mais próximos (K Nearest Neighbors - KNN) classifica uma nova instância de dados de entrada conforme a classe das instâncias mais próximas já observadas.

Está correto o que se afirma em

A

I, apenas.

B

II, apenas.

C

III, apenas.

D

I e II, apenas.

E

I, II e III.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2589860

Ano: 2024 Banca: IADES Órgão: BRB Prova: IADES - 2024 - BRB - Analista de Tecnologia da Informação |

Q2589860 Engenharia de Software

Texto associado

Texto hipotético para responder às questões 37 e 38.

João foi selecionado por sua chefia para liderar um projeto de criação de uma inteligência artificial que fosse capaz de classificar, a partir de fotos obtidas pelas câmeras de segurança de cada agência, se, ao entrar na agência, a pessoa está utilizando algum tipo de chapéu, óculos, ambos ou nenhum acessório. Uma base de dados com amostras em quantidade e qualidade suficientes foi fornecida para João. Sendo assim, ele optou por seguir com uma abordagem baseada em modelos de redes neurais.

Ao analisar a base de dados, João notou que havia imagens anotadas com a classe esperada (target preenchido) e também algumas imagens que possuíam o campo de classe esperada vazio. Primeiramente, ele considerou descartar as imagens que não possuíam a classe esperada preenchida, mas, após breve reflexão e muitas pesquisas, decidiu adotar a seguinte estratégia: utilizar as imagens que possuíam a classe esperada para treinar um modelo inicial de classificação. Esse modelo seria usado para predizer as classes das imagens com tal campo vazio. A partir desse ponto, todas as imagens teriam uma classe associada e, assim, todas poderiam ser utilizadas para treinar o modelo final. Essa abordagem é conhecida como aprendizado

A

aprendizado por reforço.

B

não supervisionado.

C

semisupervisionado.

D

por LLM.

E

via early stopping.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2589858

Ano: 2024 Banca: IADES Órgão: BRB Prova: IADES - 2024 - BRB - Analista de Tecnologia da Informação |

Q2589858 Engenharia de Software

Texto associado

Texto hipotético para responder às questões 37 e 38.

João foi selecionado por sua chefia para liderar um projeto de criação de uma inteligência artificial que fosse capaz de classificar, a partir de fotos obtidas pelas câmeras de segurança de cada agência, se, ao entrar na agência, a pessoa está utilizando algum tipo de chapéu, óculos, ambos ou nenhum acessório. Uma base de dados com amostras em quantidade e qualidade suficientes foi fornecida para João. Sendo assim, ele optou por seguir com uma abordagem baseada em modelos de redes neurais.

Considerando que João deva apresentar a solução com o menor custo computacional e financeiro para o processo de treinamento do modelo, assinale a alternativa que melhor se encaixa nessa situação.

A

Utilizar um modelo pré-treinado com uma base de dados similar ao caso de uso de João e aplicar técnicas de aprendizado por transferência.

B

Utilizar apenas a arquitetura de um modelo pré-treinado com uma base de dados similar ao caso de João, ou seja, realizar o treinamento do modelo sem aproveitar os parâmetros pré-treinados.

C

Não realizar o treinamento de um novo modelo, mas apenas reutilizar um modelo pré-treinado em qualquer outra base de dados não necessariamente similar ao problema de João. Dessa forma, não haverá nenhum tipo de custo.

D

Realizar o treinamento de um modelo sem o aproveitamento de nenhum outro modelo pré-treinado, pois o custo para retreinar um modelo pré-treinado é inviável.

E

Independentemente da solução adotada por João, o custo para treinar redes neurais é sempre alto.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2571752

Ano: 2024 Banca: FGV Órgão: TCE-PA Prova: FGV - 2024 - TCE-PA - Auditor de Controle Externo - Área Administrativa - Ciência de Dados |

Q2571752 Engenharia de Software

Alguns dos primeiros modelos de linguagem de larga escala desenvolvidos tendiam a gerar resultados incorretos com excesso de confiança, caracterizando o que se convencionou chamar de alucinações dos modelos. Uma estratégia de mitigação das alucinações é o uso da técnica de Geração Aumentada por Recuperação, ou Retrieval-Augmented Generation (RAG).
A respeito da RAG, avalie as afirmativas a seguir.
I. Baseia-se na combinação de sistemas de recuperação de informações e de modelos generativos capazes de produzir novos textos. II. Permite aos modelos buscarem informações relevantes em bases de dados mais confiáveis durante o processamento das consultas dos usuários (user queries), viabilizando melhor adequação a contextos e melhor qualidade das respostas. III. Não altera os parâmetros dos modelos generativos, e, portanto, não influencia o treinamento das redes neurais com informações recuperadas de bases de dados externas.
Está correto o que se afirma em

A

I, apenas.

B

II, apenas.

C

III, apenas.

D

I e II, apenas.

E

I, II e III.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2571750

Ano: 2024 Banca: FGV Órgão: TCE-PA Prova: FGV - 2024 - TCE-PA - Auditor de Controle Externo - Área Administrativa - Ciência de Dados |

Q2571750 Engenharia de Software

As redes neurais artificiais (Artificial Neural Networks - ANN) constituem um grupo de algoritmos inspirados nas funções dos neurônios no cérebro humano. Diversas arquiteturas de redes neurais são utilizadas para diferentes problemas, conforme suas funcionalidades.
Existe uma arquitetura de rede neural específica, especialmente apropriada ao reconhecimento de padrões de imagens e vídeos, por possuir as seguintes propriedades:
• As informações fluem apenas em uma direção. • As informações são propagadas em diferentes camadas neurais que filtram características (isto é, as features). • As informações são propagadas em diferentes camadas que reduzem sua dimensionalidade.
Das opções a seguir, as redes que mais aderem às propriedades listadas acima são as redes

A

de alimentação direta (feedforward).

B

recorrentes.

C

convolucionais.

D

generativas adversárias (GANs).

E

de Hopfield.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2571748

Ano: 2024 Banca: FGV Órgão: TCE-PA Prova: FGV - 2024 - TCE-PA - Auditor de Controle Externo - Área Administrativa - Ciência de Dados |

Q2571748 Engenharia de Software

A análise de componentes principais (Principal Component Analysis - PCA) é uma técnica de redução de dimensionalidade de dados utilizada em diversas aplicações, tais como em compressão de imagens e em processamento de linguagem natural.
Em relação à análise de componentes principais, avalie se as afirmativas a seguir são verdadeiras (V) ou falsas.
( ) Permite a identificação de correlações e de estruturas de menor dimensionalidade na distribuição espacial dos dados, caracterizadas pelas direções onde há maior variância. ( ) Envolve o cálculo de autovalores e autovetores de matrizes de covariâncias, determinando-se as componentes principais das distribuições de dados. ( ) É adequada para identificar correlações não-lineares entre os dados de um conjunto de alta dimensionalidade, projetando estruturas em espaços vetoriais de menores dimensões.
As afirmativas são, respectivamente,

A

V – F – V.

B

F – V – V.

C

F – F – V.

D

V – V – F.

E

V – F – F.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2571744

Ano: 2024 Banca: FGV Órgão: TCE-PA Prova: FGV - 2024 - TCE-PA - Auditor de Controle Externo - Área Administrativa - Ciência de Dados |

Q2571744 Engenharia de Software

Modelos de aprendizagem de máquina são, em geral, avaliados com métricas que indicam os quão poderosos e relevantes eles são. Entre exemplos de métricas de avaliação utilizadas para modelos de classificação binária, podemos citar:

• Taxa de precisão (razão entre verdadeiros positivos e o total dos verdadeiros positivos e falsos positivos); • Taxa de sensibilidade (razão entre verdadeiros positivos e o total dos verdadeiros positivos e falsos negativos, também conhecida por recall); e • Escore F1 (F1-score, também chamado de F-measure), que relaciona as taxas de precisão e de sensibilidade. Suponha a existência de um modelo de classificação binária cuja taxa de precisão é de 90,00% e cuja taxa de sensibilidade é de 75,00%. Utilize aproximação de duas casas decimais.
O escore F1 referente a esse modelo é

A

41,42%.

B

81,82%.

C

82,15%.

D

82,50%.

E

82,84%.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2571732

Ano: 2024 Banca: FGV Órgão: TCE-PA Prova: FGV - 2024 - TCE-PA - Auditor de Controle Externo - Área Administrativa - Ciência de Dados |

Q2571732 Engenharia de Software

Ao se utilizar bancos de dados reais no treinamento de métodos de aprendizado de máquina é normal se deparar com entradas que possuem um ou mais parâmetros (campos) ausentes.
Com relação às estratégias para lidar com dados ausentes, analise as afirmativas a seguir.
I. Só é possível realizar imputation quando o atributo (feature) ausente é numérico. II. Ao utilizar o k-nearest neighbors (KNN) para fazer o imputation é uma boa estratégia primeiro fazer a normalização ou padronização dos dados. III. Ao se trabalhar com bancos de dados com poucas amostras (itens), uma estratégia usualmente utilizada para lidar com as amostras) que possuem valores ausentes é a remoção.
Está correto o que se afirma em

A

I, apenas.

B

II, apenas.

C

III, apenas.

D

I e II apenas.

E

I, II e III.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2571731

Ano: 2024 Banca: FGV Órgão: TCE-PA Prova: FGV - 2024 - TCE-PA - Auditor de Controle Externo - Área Administrativa - Ciência de Dados |

Q2571731 Engenharia de Software

O tratamento dos dados influencia diretamente no desempenho de muitos algoritmos de aprendizado de máquina.
A respeito de métodos de normalização e padronização numéricos é correto afirmar que

A

são utilizados, principalmente, na detecção e remoção de outliers.

B

na normalização com min-max scaling é definida a média desejada para o atributo.

C

o uso da técnica min-max scaling é recomendada quando os dados apresentam outliers.

D

na padronização com z-score são determinadas a média e a variância desejadas para o atributo.

E

a padronização com z-score é empregada, usualmente, para garantir que o atributo terá apenas valores positivos.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

SEU FUTURO MERECE ESSA CHANCE!

SEU FUTURO MERECE ESSA CHANCE!

Questões de Concurso Sobre inteligencia artificial em engenharia de software

Foram encontradas 426 questões