Assinale a opção que apresenta a classe da biblioteca scikit...

Próximas questões
Com base no mesmo assunto
Q2234107 Programação
Assinale a opção que apresenta a classe da biblioteca scikit-learn, versão 1.2.2, utilizada em scripts python para a implementação de análises incrementais de componentes principais.
Alternativas

Gabarito comentado

Confira o gabarito comentado por um dos nossos professores

A alternativa correta é a Letra D - sklearn.decomposition.IncrementalPCA.

No contexto de aprendizado de máquina, a análise de componentes principais (PCA) é uma técnica estatística que permite reduzir a dimensionalidade dos dados, mantendo o máximo de variação possível. Essencialmente, o PCA transforma as variáveis originais em um novo conjunto de variáveis, chamadas componentes principais, que são descorrelacionadas e que capturam a maior quantidade possível da variação presente nos dados originais.

A biblioteca scikit-learn, uma das mais populares em Python para aprendizado de máquina, disponibiliza várias classes para a realização de PCA. Quando se deseja fazer análises incrementais, ou seja, capazes de processar os dados em batches ao invés de requerer toda a memória para processar os dados de uma vez, utiliza-se a classe IncrementalPCA. Isso é especialmente útil para grandes volumes de dados ou quando se trabalha com recursos de computação limitados.

Para justificar a corretude da alternativa D, é importante reconhecer a estrutura da biblioteca scikit-learn e suas convenções de nomenclatura. As classes são organizadas em módulos que refletem sua função. No caso do PCA incremental, ele está localizado no módulo decomposition, o que faz sentido, já que PCA é uma técnica de decomposição de dados. Além disso, a convenção de nome classe IncrementalPCA segue o padrão do scikit-learn, onde a capitalização CamelCase é usada para nomes de classes, e o prefixo "Incremental" indica claramente que a classe é destinada para uso em uma abordagem incremental.

As demais opções (A, B, C e E) contêm erros nos nomes dos módulos ou na nomenclatura da classe, não estando alinhadas com a documentação oficial da biblioteca scikit-learn.

Clique para visualizar este gabarito

Visualize o gabarito desta questão clicando no botão abaixo

Comentários

Veja os comentários dos nossos alunos

A classe da biblioteca scikit-learn, versão 1.2.2, utilizada em scripts python para a implementação de análises incrementais de componentes principais é a "IncrementalPCA", que está presente no módulo "decomposition". Portanto, a resposta correta é a letra D - sklearn.decomposition.IncrementalPCA. 

As outras opções apresentadas estão incorretas, pois:

A - sklearn.position.PCAIncrement: não é uma classe existente na biblioteca scikit-learn.

B - sklearn.composition.PCAIncrement: não é uma classe existente na biblioteca scikit-learn.

C - sklearn.recomposition.PCAIncrement: não é uma classe existente na biblioteca scikit-learn.

E - sklearn.recomposition.IncrementingPCA: não é uma classe existente na biblioteca scikit-learn.

✍ GABARITO(D) ✅

O segredo para fixar sobre essas bibliotecas é entender um pouco o objetivo. Tá certo que é para análises incrementais de componentes principais. Mas o que é isso?

Usado na área de BI.

  • A técnica de Análise de Componentes Principais (PCA) tem como objetivo principal a descrição da variância e covariância entre um conjunto de variáveis. Essa técnica é utilizada para mitigar redundâncias no conjunto de variáveis e para redução de dimensionalidade em várias aplicações nas áreas científica, tecnológica e administrativa. 

  • Como solução de arquitetura para o armazenamento de dados, o Data Warehouse (DW) já é consolidado no mundo corporativo. O DW permitiu integrar em um único repositório dados provenientes de diferentes fontes e, com isso, ofertar aos usuários de DSSs a possibilidade de realizar análises complexas e dinâmicas sobre dados que não eram facilmente obtidos. Porém, essa abundância de dados pode dificultar a compreensão de como as diferentes variáveis analisadas se relacionam. O DW, por sua característica desnormalizada, pode aumentar a dimensionalidade da análise, tornando o número de variáveis analisadas muito alto e aumentando, assim, sua complexidade. A técnica estatística de Análise de Componentes Principais (Principal Component Analysis, PCA) tem como um de seus objetivos reduzir a dimensionalidade do sistema, por meio da definição de uma nova base, cujos componentes são as Componentes Principais (PC), obtidas a partir da matriz de covariância das variáveis originais.

Por isso o nome "decomposition" na biblioteca. Consiste na decomposição da base principal, ou pelo menos boa parte das informações a serem analisadas em uma nova base, cujos componentes são as Componentes Principais (PC).

Já o "sklearn" de aprender, relacionado a possibilidade de realizar análises complexas e dinâmicas sobre dados que não eram facilmente obtidos.

Fonte: https://teses.usp.br/teses/disponiveis/45/45134/tde-07012018-182730/publico/mestrado.pdf

Clique para visualizar este comentário

Visualize os comentários desta questão clicando no botão abaixo