O auditor de contas públicas João deverá realizar uma audito...
Nesse contexto, para criar esse modelo, João deverá aplicar a técnica de classificação binária:
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
A alternativa correta para a questão é a C - árvore de decisão.
Vamos entender o motivo dessa escolha e analisar as outras alternativas para esclarecer suas especificidades.
Árvore de Decisão:
As árvores de decisão são uma técnica de aprendizado supervisionado usada tanto para classificação quanto para regressão. Elas são especialmente úteis porque são simples de interpretar e visualizar, o que é ideal para auditorias financeiras como no caso do auditor João. Nessa estrutura, os dados são divididos em subconjuntos menores, enquanto uma árvore associada é incrementada ao mesmo tempo. A árvore de decisão faz a classificação ao percorrer os nós da árvore e tomar decisões baseadas nas características dos dados. Dada a necessidade de interpretar facilmente o modelo, esta é a escolha mais apropriada.
Análise das Alternativas Incorretas:
A - k-means:
O k-means é um método de clusterização, que é uma técnica de aprendizado não supervisionado. Ele é usado para agrupar dados em k clusters (grupos) baseados na similaridade entre os pontos de dados. No contexto de classificação binária, como a distinção entre transações "suspeitas" e "não suspeitas", o k-means não é a melhor escolha porque não oferece uma classificação direta e simples.
B - regressão linear:
A regressão linear é uma técnica de aprendizado supervisionado usada para prever valores contínuos. Embora seja uma técnica poderosa para previsões numéricas, ela não é adequada para problemas de classificação binária, onde a resposta deve ser uma das duas classes possíveis.
D - rede neural artificial:
As redes neurais artificiais são modelos complexos e poderosos que podem resolver uma variedade de problemas, incluindo classificação binária. No entanto, elas são muitas vezes consideradas como caixas-pretas devido à sua complexidade, dificultando a interpretação das decisões tomadas pelo modelo. Para um auditor que precisa interpretar e justificar suas análises, esta não é a melhor opção.
E - análise de componentes principais:
A análise de componentes principais (PCA) é uma técnica de redução de dimensionalidade usada para transformar um conjunto de variáveis possivelmente correlacionadas em um conjunto de valores de variáveis linearmente não correlacionadas chamadas componentes principais. Embora útil para simplificação de dados e visualização, o PCA não é uma técnica de classificação.
Portanto, a árvore de decisão é a melhor escolha para a situação apresentada, devido à sua simplicidade e interpretabilidade, características cruciais para um auditor financeiro que precisa justificar suas conclusões.
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
O que significa árvore de decisão?
Uma árvore de decisão é um mapa dos possíveis resultados de uma série de escolhas relacionadas. Permite que um indivíduo ou organização compare possíveis ações com base em seus custos, probabilidades e benefícios.
A) k-means: O k-means é um algoritmo de clustering, não de classificação. Ele agrupa os dados em clusters com base na similaridade entre os pontos de dados, mas não é usado para prever rótulos de classe.
B) Regressão linear: A regressão linear é usada para modelar a relação entre uma variável dependente contínua e uma ou mais variáveis independentes. Ela não é apropriada para problemas de classificação binária, como o descrito, onde estamos tentando prever uma classe discreta (suspeita ou não suspeita).
C) Árvore de decisão: As árvores de decisão são modelos de aprendizado de máquina que dividem o espaço de atributos em regiões distintas e fazem previsões com base nas características dos dados. Elas são interpretáveis, simples de entender e podem ser facilmente visualizadas, o que as torna adequadas para o caso de João, que deseja um modelo simples e interpretável para classificar transações como suspeitas ou não suspeitas.
D) Rede neural artificial: As redes neurais artificiais são modelos de aprendizado de máquina mais complexos e poderosos que podem aprender padrões complexos nos dados. No entanto, para conjuntos de dados relativamente pequenos e quando a interpretabilidade é uma consideração importante, elas podem ser excessivamente complexas e difíceis de interpretar.
E) Análise de componentes principais: A análise de componentes principais é uma técnica de redução de dimensionalidade que é usada para encontrar as características mais importantes nos dados. No entanto, ela não é uma técnica de classificação e não pode ser usada diretamente para prever rótulos de classe.
Portanto, a árvore de decisão é a opção mais adequada para João criar um modelo de aprendizado de máquina simples e interpretável para classificar transações como suspeitas ou não suspeitas.
Fonte: Chat GPT
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo