A respeito de dados estruturados e não estruturados, julgue ...

Próximas questões
Com base no mesmo assunto
Q2276012 Banco de Dados
A respeito de dados estruturados e não estruturados, julgue o item seguinte.

Se, em certa organização, grande parte dos dados for constituída de dados estruturados, mas também houver muitos dados de arquivos .pdf e .docx, então os dados, em geral, serão classificados como semiestruturados.
Alternativas

Gabarito comentado

Confira o gabarito comentado por um dos nossos professores

Alternativa correta: E - errado

A definição precisa de dados estruturados, não estruturados e semiestruturados é essencial para entender o porquê da alternativa E estar correta:

  • Dados estruturados: são aqueles armazenados em formatos altamente organizados e fáceis de acessar, processar e analisar. Geralmente, encontrados em bancos de dados tradicionais em tabelas com linhas e colunas.
  • Dados não estruturados: não possuem um modelo de dados ou são armazenados em formatos que não são tão facilmente processados por máquinas, como vídeos, imagens, e-mails, documentos em texto livre etc.
  • Dados semiestruturados: encontram-se entre os dois extremos anteriores. Eles não possuem uma estrutura rígida como os dados estruturados, mas apresentam marcadores ou outros elementos de metadados para separar elementos de dados e impor hierarquias.

O fato de uma organização ter uma grande quantidade de dados estruturados e também possuir muitos arquivos em formatos .pdf e .docx não significa que os dados, em geral, devem ser classificados como semiestruturados. Os arquivos .pdf e .docx são exemplos de dados não estruturados, pois, apesar de poderem conter certo nível de organização visual e marcações, não se enquadram no modelo de fácil processamento típico dos dados estruturados ou semiestruturados.

Portanto, a presença de ambos os tipos de dados na organização indica uma mistura de dados estruturados e não estruturados, mas não justifica categorizar o conjunto geral de dados como semiestruturados. A categorização dependeria de uma análise mais detalhada que indique se há características ou metadados associando esses arquivos de uma forma que possa ser sistematicamente processada e analisada.

Clique para visualizar este gabarito

Visualize o gabarito desta questão clicando no botão abaixo

Comentários

Veja os comentários dos nossos alunos

Gab: Errado

Não estruturado...

... .pdf e .docx são considerados formatos de dados não estruturados, pois não seguem um esquema fixo ou uma estrutura predefinida como em bancos de dados relacionais. Eles contêm informações em formatos que podem variar amplamente, incluindo texto, imagens e outros elementos gráficos...

exemplos clássicos de semi estruturados são XML e JSON

Dados Estruturados

Os dados estruturados são organizados em uma estrutura predefinida e são fáceis de consultar e analisar. Eles são armazenados em tabelas com colunas e linhas que representam os campos e registros. Esses dados são geralmente armazenados em bancos de dados relacionais e são muito comuns em sistemas de gerenciamento de banco de dados. Exemplos de dados estruturados incluem nomes, endereços, números de telefone, datas e valores numéricos.

Dados Semi-Estruturados

Os dados semi-estruturados são uma combinação dos dados estruturados e não estruturados. Eles são organizados, mas não seguem uma estrutura rígida como os dados estruturados. Em vez disso, eles têm um formato predefinido que permite a consulta e análise. Esses dados são geralmente armazenados em formatos como XML, JSON e YAML. Exemplos de dados semi-estruturados incluem páginas da web, documentos XML e arquivos JSON.

Dados Não Estruturados

Os dados não estruturados são informações que não seguem uma estrutura predefinida. Eles não estão organizados em tabelas ou bancos de dados relacionais, e podem incluir coisas como arquivos de texto, imagens, áudio e vídeo. Exemplos de dados não estruturados incluem e-mails, documentos, páginas da web, feeds de mídia social, arquivos de imagem e de áudio.

O banco de dados mais frequentemente usado para dados não estruturados é o NoSQL. NoSQL significa “não somente SQL”, indicando que o banco de dados pode lidar com uma gama mais ampla de dados além dos recursos dos bancos de dados SQL.

Fonte: dataside

PLUS para os estudos: Há alguns diferentes tipos de documentos, cada um dos quais permite formatação e benefícios diferentes. Alguns dos formatos de arquivo de documento mais comuns incluem PDF, DOC e DOCX, HTML e HTM, e XLS e XLSX.

Dados estruturados: São dados organizados em um formato predefinido, como tabelas de bancos de dados relacionais, planilhas, etc. Esses dados são facilmente pesquisáveis e utilizáveis por algoritmos e ferramentas de análise de dados.

Dados não estruturados: São dados que não seguem uma estrutura específica e não estão organizados em um formato predefinido. Exemplos incluem arquivos de texto (.txt), documentos (.pdf, .docx), imagens (.jpg, .png), áudio (.mp3, .wav), e vídeos (.mp4, .wmv).

Dados semiestruturados: São dados que não seguem uma estrutura rígida, mas possuem alguma organização, como tags ou marcadores que facilitam a análise. Exemplos incluem arquivos XML, JSON, e e-mails.

Se em uma organização a maior parte dos dados for constituída de dados estruturados, mas também houver muitos arquivos .pdf e .docx, isso não significa que os dados em geral serão classificados como semiestruturados. Os arquivos .pdf e .docx são considerados dados não estruturados, pois não possuem uma estrutura fixa que possa ser facilmente interpretada por sistemas de banco de dados convencionais.

Portanto, a mistura de dados estruturados e não estruturados em uma organização não transforma automaticamente esses dados em dados semiestruturados. A classificação dos dados deve ser feita com base nas características predominantes de estruturação de cada tipo de dado.

Dessa forma, a afirmativa está incorreta.

Clique para visualizar este comentário

Visualize os comentários desta questão clicando no botão abaixo