Em um projeto de mineração de dados para um banco de varejo...

Próximas questões
Com base no mesmo assunto
Q3035505 Banco de Dados
Em um projeto de mineração de dados para um banco de varejo que deseja prever a probabilidade de inadimplência de empréstimos, são coletados dados de clientes, incluindo histórico de crédito, renda, emprego e comportamento de pagamento. Ao preparar esses dados para análise, qual dos seguintes tipos de atributos é essencial para a modelagem preditiva da inadimplência?
Alternativas

Gabarito comentado

Confira o gabarito comentado por um dos nossos professores

Alternativa Correta: C - Atributos binários, como histórico de inadimplência (sim/não), que fornecem uma distinção clara na capacidade de pagamento do cliente.

Vamos entender melhor o contexto da questão. Em um projeto de mineração de dados para prever a inadimplência de empréstimos, a escolha dos atributos é crucial para a modelagem preditiva. A capacidade de predizer se um cliente irá se tornar inadimplente ou não depende dos dados coletados e de como eles são utilizados na modelagem.

Os atributos binários são essenciais neste contexto porque oferecem uma distinção clara entre duas categorias: sim, o cliente tem histórico de inadimplência, ou não, o cliente não possui esse histórico. Essa distinção é fundamental para modelos preditivos, como árvores de decisão ou modelos de regressão logística, que são frequentemente utilizados para classificar dados em duas categorias.

Agora, vamos analisar as outras alternativas:

A - Atributos nominais categorizam os clientes em grupos sem uma ordem intrínseca, como tipo de emprego. Apesar de úteis para entender a composição dos dados, eles não são essenciais para prever inadimplência, pois não fornecem uma informação direta sobre a capacidade de pagamento.

B - Atributos ordinais, como faixas de renda, classificam clientes em categorias com uma ordem específica. Embora possam enriquecer o modelo ao oferecer uma visão sobre o padrão de renda, não são tão diretos quanto os binários na previsão de inadimplência.

D - Atributos de intervalo medem quantidades em escalas contínuas, como taxas de juros. Estes são importantes para cálculos matemáticos, mas não fornecem uma clara indicação binária que é diretamente aplicável na previsão de inadimplência.

Portanto, a alternativa C é a mais adequada, pois o histórico de inadimplência em formato binário é diretamente utilizado em modelos preditivos para distinguir entre clientes que são propensos a serem inadimplentes e aqueles que não são.

Gostou do comentário? Deixe sua avaliação aqui embaixo!

Clique para visualizar este gabarito

Visualize o gabarito desta questão clicando no botão abaixo