Considere que um analista da Prefeitura de Rio Branco
necessite utilizar técnicas de mineração de dados para
classificar contribuintes do município com base no risco de
inadimplência. Uma vez que o conjunto de dados a ser
tratado é linearmente separável e, para lidar com essa
característica, o analista adotará o uso de um kernel, o
algoritmo adequado para essa tarefa é

Question

Considere que um analista da Prefeitura de Rio Branco
necessite utilizar técnicas de mineração de dados para
classificar contribuintes do município com base no risco de
inadimplência. Uma vez que o conjunto de dados a ser
tratado é linearmente separável e, para lidar com essa
característica, o analista adotará o uso de um kernel, o
algoritmo adequado para essa tarefa é Alternativa A: árvore de decisão. Ou Alternativa B: k-means. Ou Alternativa C: regressão logística. Ou Alternativa D: máquina de vetores de suporte.

Qconcursos · Accepted Answer

Alternativa [D] máquina de vetores de suporte. A alternativa correta é a Alternativa D - Máquina de Vetores de Suporte (SVM, do inglês Support Vector Machine).

Vamos entender por quê:

Na questão, é mencionado que o conjunto de dados a ser analisado é linearmente separável. Isso significa que é possível traçar uma linha reta (ou hiperplano em dimensões superiores) que divida as classes de dados de maneira clara. O algoritmo Máquina de Vetores de Suporte é muito eficaz para esse tipo de problema. Ele busca a linha de separação (hiperplano) que maximiza a margem entre as diferentes classes, garantindo uma boa generalização dos dados.

Além disso, a questão menciona o uso de um kernel. Os kernels são utilizados em SVM para lidar com dados que não são linearmente separáveis em sua forma original, permitindo que eles sejam transformados para um espaço de maior dimensão onde a separação linear é possível. Portanto, o uso de SVM com kernel é apropriado para lidar com a característica descrita no problema.

Agora, vejamos por que as outras alternativas estão incorretas:

A - Árvore de decisão: Árvores de decisão são modelos que dividem os dados em subconjuntos com base em características dos dados, criando uma estrutura de árvore. Elas não utilizam kernéis e são mais indicadas para problemas onde a relação entre as variáveis não precisa ser linearmente separável.

B - K-means: K-means é um algoritmo de agrupamento, não de classificação, e não utiliza kernéis. Ele agrupa dados em k clusters com base na proximidade dos dados em relação ao centro de cada cluster. Não é adequado para o problema apresentado, que é de classificação com dados linearmente separáveis.

C - Regressão logística: A regressão logística é utilizada para problemas de classificação binária e não utiliza kernéis. Ela modela a probabilidade de uma classe baseada na função logística, sendo mais apropriada para dados que seguem uma distribuição linear, mas sem transformação de espaço via kernel.

Em resumo, a Máquina de Vetores de Suporte é a escolha ideal quando se trata de dados linearmente separáveis e quando se deseja aplicar um kernel para melhorar a separação em um espaço dimensional maior. Isso faz dela a melhor opção entre as alternativas apresentadas.

Gostou do comentário? Deixe sua avaliação aqui embaixo!

SEJA VITALÍCIO

SEJA VITALÍCIO

Considere que um analista da Prefeitura de Rio Branco neces...

Gabarito comentado

Clique para visualizar este gabarito

Comentários

Clique para visualizar este comentário

Questões de assuntos semelhantes

Provas relacionadas