Em aprendizado de máquina, especialmente em
algoritmos de árvores de decisão, é fundamental avaliar como os
dados são organizados e classificados em diferentes níveis da
árvore. Três conceitos-chave que auxiliam na construção e
otimização dessas árvores são o gini impurity, a entropy e o
information gain. A respeito desses conceitos, julgue os itens a
seguir.
I Gini impurity mede a redução da entropy após a divisão de
um conjunto de dados com base em um atributo.
II Entropy mede a quantidade de incerteza ou impureza no
conjunto de dados.
III Information gain mede a probabilidade de uma nova instância
ser classificada incorretamente, com base na distribuição de
classes no conjunto de dados.
Assinale a opção correta.

Question

Em aprendizado de máquina, especialmente em
algoritmos de árvores de decisão, é fundamental avaliar como os
dados são organizados e classificados em diferentes níveis da
árvore. Três conceitos-chave que auxiliam na construção e
otimização dessas árvores são o gini impurity, a entropy e o
information gain. A respeito desses conceitos, julgue os itens a
seguir.
I Gini impurity mede a redução da entropy após a divisão de
um conjunto de dados com base em um atributo.
II Entropy mede a quantidade de incerteza ou impureza no
conjunto de dados.
III Information gain mede a probabilidade de uma nova instância
ser classificada incorretamente, com base na distribuição de
classes no conjunto de dados.
Assinale a opção correta. Alternativa A: Apenas o item II está certo.   Ou Alternativa B: Apenas o item III está certo.   Ou Alternativa C: Apenas os itens I e II estão certos.   Ou Alternativa D: Apenas os itens I e III estão certos.

Qconcursos · Accepted Answer

Alternativa [A] Apenas o item II está certo.   A alternativa correta é A - Apenas o item II está certo.

Vamos explorar os conceitos mencionados na questão e entender por que essa é a resposta correta.

Item I - Gini impurity: Este conceito é usado para medir a impureza de um nó em uma árvore de decisão. Ele não mede a redução de entropy, mas sim a probabilidade de uma instância ser classificada incorretamente ao escolher aleatoriamente um rótulo de acordo com a distribuição de rótulos no nó. Portanto, a afirmação do item I está incorreta.

Item II - Entropy: A entropy mede a quantidade de incerteza ou impureza em um conjunto de dados. Ela quantifica a desordem ou imprevisibilidade dos dados, sendo um conceito fundamental para avaliar o quão ordenado ou desordenado um conjunto de dados está. Este item está correto e explica precisamente o papel da entropia em algoritmos de aprendizado de máquina.

Item III - Information gain: O information gain mede a redução na entropy após a divisão dos dados com base em um atributo, e não a probabilidade de uma nova instância ser classificada incorretamente. Portanto, a explicação fornecida no item III está incorreta.

Com base nas justificativas acima, fica claro que apenas o item II está correto, o que confirma a escolha da alternativa A como correta.

Gostou do comentário? Deixe sua avaliação aqui embaixo!

SEJA VITALÍCIO

SEJA VITALÍCIO

Em aprendizado de máquina, especialmente em algoritmos ...

Gabarito comentado

Clique para visualizar este gabarito

Comentários

Clique para visualizar este comentário

Questões de assuntos semelhantes

Provas relacionadas