Questões de Banco de Dados - Big Data para Concurso
Foram encontradas 238 questões
O analista Igor está explorando diversos dados sobre transações
financeiras disponíveis no ambiente de big data da CVM. Para
apoiar suas análises, Igor quer visualizar os dados em gráficos.
Para analisar tendências, Igor deve usar o gráfico do tipo:
Para processar as negociações financeiras como uma sequência de eventos no tempo, agrupando e filtrando os dados à medida que são capturados, o componente da arquitetura de big data que Tiago deve desenvolver é o:
Diante desse contexto, assinale a opção que apresenta um benefício chave dos sistemas de armazenamento de dados de alta performance.
I Como qualquer tecnologia, soluções de big data também apresentam algumas restrições. Por exemplo, elas não podem ser utilizadas na área da saúde para determinar a causa de uma doença, porque esse é um procedimento complexo que somente pode ser executado por pessoas devidamente capacitadas — nesse caso, os médicos.
II Big data é qualquer tipo de fonte de dados que possui, no mínimo, as seguintes três características: volume de dados extremamente grande; velocidade de dados extremamente alta; e variedade de dados extremamente ampla.
III Para que as organizações obtenham os conhecimentos corretos, a tecnologia big data não permite que elas executem as operações de armazenar e administrar as grandes quantidades de dados de si próprias.
IV Big data é uma combinação de tecnologias de gestão de dados que evoluíram ao longo dos anos, razão por que não é considerado um mercado único.
Estão certos apenas os itens
Para implementar esse tipo de banco de dados, é necessário:
Acerca de Big data, bancos de dados distribuídos e soluções de suporte à decisão, julgue o item seguinte.
A veracidade em Big data aborda os possíveis problemas
que os dados gerados podem apresentar, como a presença de
dados incompletos, corrompidos ou com anomalias, os quais
podem resultar em diferentes níveis de incerteza e
confiabilidade.
(https://www.questionpro.com/blog/pt-br)
O texto acima está relacionado ao conceito de
Com relação a arquitetura e política de armazenamento de dados e engenharia de dados — ingestão e armazenamento de grande quantidade de dados Big Data, julgue o item subsequente.
A utilização da ingestão de dados para coletar dados de
várias fontes e enviá-los para um repositório Big Data pode
apresentar alguns desafios como usar os sistemas escaláveis,
para lidar com os grandes volumes de dados, garantir que os
dados sejam processados em tempo hábil, ter confiabilidade
e ser seguro.
Acerca do processo ETL (extrair, transformar, carregar) e da manipulação, tratamento e visualização de dados, julgue o item que se segue.
Em ETL, o armazenamento de dados pode ser feito em
bancos de dados ou em data warehouse, mas não em
data lakes, porque estes seguem um padrão diferente e,
geralmente, armazenam seus dados por meio do
armazenamento de objetos ou nos HDFS (hadoop distributed
file systems).
No que se refere a modelagem dimensional, mineração de dados e big data, julgue o item subsequente.
Em big data, a premissa variedade refere-se ao acréscimo dos volumosos tipos de dados semiestruturados e não estruturados aos
tradicionais conjuntos de dados estruturados das organizações, responsável por impor desafios contextuais adicionais para o
armazenamento, o tratamento e a análise dos dados dessas organizações.
( ) Em um sistema BigData, o pipeline de dados implementa as etapas necessárias para mover dados de sistemas de origem, transformar esses dados com base nos requisitos e armazenar os dados em um sistema de destino, incluindo todos os processos necessários para transformar dados brutos em dados preparados que os usuários podem consumir.
( ) Dentre os métodos de manipulação de valores ausentes, em processamento massivo e paralelo, consta a normalização numérica, que se refere ao processo de ajustar os dados para que estejam em uma escala comparável, geralmente entre 0 e 1.
( ) A demanda crescente por medidas de criptografia ponta a ponta (da produção ao backup) tornam menos eficazes e relevantes tecnologias legadas, como a deduplicação de dados (data deduplication), que busca ajudar a otimizar o armazenamento e melhorar o desempenho de um sistema ao estabelecer processo de identificar e eliminar dados duplicados em um sistema.
As afirmativas são, respectivamente,
Esses resultados vieram com a adoção da tecnologia nos processos cotidianos, e também com o investimento em pesquisas [...]. Agora, o agronegócio pode estar diante de um novo salto de produtividade; big data e machine learning são ferramentas que estão ganhando espaço e que podem, novamente, transformar o cenário do campo.
Disponível em: https://summitagro.estadao.com.br/tendencias-e- -tecnologia/como-big-data-e-machine-learning-sao-aplicados-no- -agronegocio/. Acesso em: 5 jan. 2024. Adaptado.
A utilização da plataforma paralela de processamento MapReduce aplica-se adequadamente como um framework de processamento de Big Data, visando à escalabilidade para as aplicações.
Nesse contexto, uma característica inerente à MapReduce é a
O componente Spark Core
1. Volume.
2. Variedade.
3. Veracidade.
4. Velocidade.
( ) É um termo cunhado pela IBM que está sendo usado como o quarto “V” para descrever Big Data. Refere-se à conformidade com os fatos: precisão, qualidade ou confiabilidade dos dados. Ferramentas e técnicas são frequentemente usadas para lidar com Big Data, transformando os dados em insights de qualidade e confiáveis.
( ) Significa a celeridade com que os dados estão sendo produzidos e com que presteza os dados devem ser processados (ou seja, capturados, armazenados e analisados) para atender a necessidade ou demanda. Talvez seja a característica mais negligenciada do Big Data.
( ) É a característica mais comum do Big Data. Muitos fatores contribuíram ao aumento exponencial na quantidade de dados, como dados baseados em transações armazenados ao longo dos anos, os dados das mídias sociais, aumentando a quantidade de dados de sensores, dados RFID e GPS gerados automaticamente e assim por diante.
( ) Atualmente os dados hoje possuem diversos e tipos e formatos, desde bancos de dados relacionais aos XML e dados capturados por sensores, vídeo, áudio. Segundo estimativas, 80 a 85 por cento de todos os dados das organizações estão em algum tipo de formato não estruturado ou semiestruturado.
A relação correta, na ordem dada, é
Sobre as características do Big Data, analise os itens a seguir.
I. Veracidade.
II. Valor.
III. Validade.
Está correto o que se afirma em
Com relação a Big Data, julgue o item seguinte.
Volume, variedade, velocidade, valor, veracidade,
variabilidade e visualização são conceitos abrangidos na
definição de Big Data.