Assinale a opção que apresenta a classe da biblioteca scikit...
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
A alternativa correta é a Letra D - sklearn.decomposition.IncrementalPCA
.
No contexto de aprendizado de máquina, a análise de componentes principais (PCA) é uma técnica estatística que permite reduzir a dimensionalidade dos dados, mantendo o máximo de variação possível. Essencialmente, o PCA transforma as variáveis originais em um novo conjunto de variáveis, chamadas componentes principais, que são descorrelacionadas e que capturam a maior quantidade possível da variação presente nos dados originais.
A biblioteca scikit-learn, uma das mais populares em Python para aprendizado de máquina, disponibiliza várias classes para a realização de PCA. Quando se deseja fazer análises incrementais, ou seja, capazes de processar os dados em batches ao invés de requerer toda a memória para processar os dados de uma vez, utiliza-se a classe IncrementalPCA
. Isso é especialmente útil para grandes volumes de dados ou quando se trabalha com recursos de computação limitados.
Para justificar a corretude da alternativa D, é importante reconhecer a estrutura da biblioteca scikit-learn e suas convenções de nomenclatura. As classes são organizadas em módulos que refletem sua função. No caso do PCA incremental, ele está localizado no módulo decomposition
, o que faz sentido, já que PCA é uma técnica de decomposição de dados. Além disso, a convenção de nome classe IncrementalPCA
segue o padrão do scikit-learn, onde a capitalização CamelCase é usada para nomes de classes, e o prefixo "Incremental" indica claramente que a classe é destinada para uso em uma abordagem incremental.
As demais opções (A, B, C e E) contêm erros nos nomes dos módulos ou na nomenclatura da classe, não estando alinhadas com a documentação oficial da biblioteca scikit-learn.
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
A classe da biblioteca scikit-learn, versão 1.2.2, utilizada em scripts python para a implementação de análises incrementais de componentes principais é a "IncrementalPCA", que está presente no módulo "decomposition". Portanto, a resposta correta é a letra D - sklearn.decomposition.IncrementalPCA.
As outras opções apresentadas estão incorretas, pois:
A - sklearn.position.PCAIncrement: não é uma classe existente na biblioteca scikit-learn.
B - sklearn.composition.PCAIncrement: não é uma classe existente na biblioteca scikit-learn.
C - sklearn.recomposition.PCAIncrement: não é uma classe existente na biblioteca scikit-learn.
E - sklearn.recomposition.IncrementingPCA: não é uma classe existente na biblioteca scikit-learn.
✍ GABARITO(D) ✅
O segredo para fixar sobre essas bibliotecas é entender um pouco o objetivo. Tá certo que é para análises incrementais de componentes principais. Mas o que é isso?
Usado na área de BI.
- A técnica de Análise de Componentes Principais (PCA) tem como objetivo principal a descrição da variância e covariância entre um conjunto de variáveis. Essa técnica é utilizada para mitigar redundâncias no conjunto de variáveis e para redução de dimensionalidade em várias aplicações nas áreas científica, tecnológica e administrativa.
- Como solução de arquitetura para o armazenamento de dados, o Data Warehouse (DW) já é consolidado no mundo corporativo. O DW permitiu integrar em um único repositório dados provenientes de diferentes fontes e, com isso, ofertar aos usuários de DSSs a possibilidade de realizar análises complexas e dinâmicas sobre dados que não eram facilmente obtidos. Porém, essa abundância de dados pode dificultar a compreensão de como as diferentes variáveis analisadas se relacionam. O DW, por sua característica desnormalizada, pode aumentar a dimensionalidade da análise, tornando o número de variáveis analisadas muito alto e aumentando, assim, sua complexidade. A técnica estatística de Análise de Componentes Principais (Principal Component Analysis, PCA) tem como um de seus objetivos reduzir a dimensionalidade do sistema, por meio da definição de uma nova base, cujos componentes são as Componentes Principais (PC), obtidas a partir da matriz de covariância das variáveis originais.
Por isso o nome "decomposition" na biblioteca. Consiste na decomposição da base principal, ou pelo menos boa parte das informações a serem analisadas em uma nova base, cujos componentes são as Componentes Principais (PC).
Já o "sklearn" de aprender, relacionado a possibilidade de realizar análises complexas e dinâmicas sobre dados que não eram facilmente obtidos.
Fonte: https://teses.usp.br/teses/disponiveis/45/45134/tde-07012018-182730/publico/mestrado.pdf
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo