Dados para a formação de data warehouses podem ser provenien...

Próximas questões
Com base no mesmo assunto
Q80547 Banco de Dados
Acerca de data warehousing, data mining e OLAP (online
analytical processing
), julgue os itens que se seguem.

Dados para a formação de data warehouses podem ser provenientes de e-mails, conversas de telefone, documentos, planilhas. A abordagem linguística utiliza a análise de strings de caracteres para classificar o texto em determinadas categorias, que são definidas previamente de acordo com o objetivo da empresa.
Alternativas

Gabarito comentado

Confira o gabarito comentado por um dos nossos professores

Alternativa correta: E - errado

A afirmação é incorreta pois, apesar de dados para a formação de data warehouses poderem ser oriundos de diversas fontes, incluindo e-mails, conversas telefônicas, documentos e planilhas, a caracterização da abordagem mencionada na questão, a análise linguística e classificação de textos, é mais especificamente relacionada ao campo de processamento de linguagem natural (PLN) e mineração de textos, que são técnicas utilizadas em Data Mining (mineração de dados).

Data Warehousing trata do armazenamento e da organização de grandes volumes de dados de forma consolidada, com o intuito de facilitar a análise e extração de insights. É um componente vital em um ambiente de Business Intelligence (BI). Por outro lado, Data Mining é um processo analítico projetado para explorar grandes quantidades de dados na busca de padrões consistentes e/ou relações sistemáticas entre variáveis, e o OLAP é uma ferramenta de análise que permite aos usuários obterem respostas rápidas a consultas multidimensionais.

Portanto, a abordagem de análise de strings de caracteres para classificar textos não é uma descrição precisa das técnicas usadas especificamente em Data Warehousing, tornando a afirmação errada e resultando na alternativa E como a correta.

Clique para visualizar este gabarito

Visualize o gabarito desta questão clicando no botão abaixo

Comentários

Veja os comentários dos nossos alunos

Essa descrição me parece compatível com Data Mining, portanto: Errada!
Toda a questão está correta exceto por um único trecho.  A definição dada se refere a abordagem temática e não a abordagem linguística(a qual é mais complexa e pouco flexível pois é embasada na língua em que se escreve). Tanto a abordagem lingística como a abordagem temática são aplicadas no processo de entendimento dos dados não estruturados antes dos mesmos serem inseridos(carregados) no datawarehouse.

Vamos quebrar a questão em dois itens:

1. Dados para a formação de data warehouses podem ser provenientes de e-mails, conversas de telefone, documentos, planilhas.

Item CERTO (eu também não sabia disso ).

Vejam [1]:

“A arquitetura do DW 2.0™ propõe, conforme mencionado, a incorporação de dados não-estruturados no processo de Data Warehousing. Esses dados podem ser provenientes de e-mails, conversas de telefone, documentos, planilhas, etc. Devido à natureza destes dados, que têm como essência o texto livre, incorporá-los simplesmente no mundo analítico, segundo Inmon, criaria um universo de análise muito pouco produtivo, sendo necessário que estes textos passem por uma série de tratamentos antes de serem incorporados efetivamente. É preciso separar o conteúdo realmente relevante para a empresa.”

 

2. A abordagem linguística utiliza a análise de strings de caracteres para classificar o texto em determinadas categorias, que são definidas previamente de acordo com o objetivo da empresa.

Item ERRADO.

O que o item trouxe foi a descrição da abordagem TEMÁTICA [1]:

“A abordagem lingüística trata o texto de acordo com a língua na qual ele está escrito, sendo sua utilização muito complexa e pouco flexível (uma análise deve ser feita para cada língua). A abordagem temática utiliza a análise de strings de caracteres para classificar o texto em determinadas categorias, que são definidas previamente de acordo com o objetivo da empresa.”

 

Referência:

[1] Uma abordagem multifacetada para exploração integrada de dados estruturados e não-estruturados em ambientes OLAP:http://teses2.ufrj.br/15/teses/735155.pdf

fonte aleatória ein, não dava para a banca tirar tudo de uma referência, tipo o Data Warehouse Toolkit? nunca ouvi falar nisso...

Clique para visualizar este comentário

Visualize os comentários desta questão clicando no botão abaixo