Questões de Concurso
Sobre big data em banco de dados
Foram encontradas 287 questões
A principal característica de um data lake é sua capacidade de armazenar diferentes tipos de dados (estruturados, semiestruturados e não estruturados) sem a necessidade de um esquema antecipadamente definido.
Julgue o item que se segue, relativo a storytelling.
Recomenda-se que a storytelling reflita valores compartilhados com o público-alvo como estratégia de conquista de confiança.
A respeito de transformação digital, julgue o item a seguir.
O Brasil desenvolve políticas públicas destinadas à ampliação do acesso da população à Internet e às tecnologias digitais, um dos requisitos para a promoção da transformação digital.
A respeito de transformação digital, julgue o item a seguir.
As políticas públicas para a transformação digital dirigem-se preferencialmente a empresas de médio e grande porte, em razão de sua maior capacidade de investimento.
A respeito de transformação digital, julgue o item a seguir.
No Brasil, a oferta de serviço de conexão à Internet distribui-se equilibradamente em todo o território nacional.
A respeito de transformação digital, julgue o item a seguir.
Admite-se o uso das compras públicas como instrumento para o desenvolvimento de tecnologias digitais inovadoras.
A respeito de transformação digital, julgue o item a seguir.
Dados os altos investimentos do Estado brasileiro em tecnologia da informação, sua estratégia digital prioriza alguns setores da economia em que a transformação digital deve ocorrer.
Em relação a manipulação e limpeza de dados, julgue o item a seguir.
A transformação de dados categóricos utilizando codificação one-hot sempre reduz a dimensionalidade do conjunto de dados.
Em relação a manipulação e limpeza de dados, julgue o item a seguir.
A normalização dos dados é importante na preparação de dados para modelos de aprendizado de máquina, pois garante que todas as variáveis estejam na mesma escala, independentemente de sua importância no modelo.
Em relação a manipulação e limpeza de dados, julgue o item a seguir.
Local outlier factor é uma técnica de detecção de outliers que mede a anomalia de um dado com base na densidade local dos seus vizinhos.
Julgue o próximo item, a respeito de machine leaning.
A biblioteca Scikit-learn é amplamente utilizada para aprendizado de máquina em Python, mas não é especializada em processamento de linguagem natural nem oferece suporte robusto para redes neurais profundas.
Julgue o próximo item, a respeito de machine leaning.
Árvores de decisão são técnicas de modelagem preditiva que particionam iterativamente os dados em subconjuntos homogêneos baseados em variáveis explicativas.
Julgue o próximo item, a respeito de machine leaning.
Os algoritmos de regressão linear, por minimizarem a soma dos resíduos quadrados para ajustar os coeficientes, são sensíveis a outliers, que podem distorcer os coeficientes e comprometer a previsão do modelo.
Julgue o próximo item, a respeito de machine leaning.
Grandes volumes de dados frequentemente revelam padrões e tendências que são valiosos para análises preditivas e tomadas de decisão, facilitando a antecipação de comportamentos futuros e permitindo melhor alocação de recursos e planejamento.
Assinale a opção que melhor define o conceito de veracidade.
I. Enquanto dados não estruturados são normalmente armazenados em seu formato nativo (como vídeos, imagens ou documentos de texto), dados estruturados são armazenados em linhas e colunas e podem ser mapeados para campos predefinidos.
II. Ao contrário dos dados estruturados, que podem ser organizados e acessados por meio de bancos de dados relacionais, dados não estruturados não têm um modelo rígido de organização predefinido.
III. Conjuntos de dados semiestruturados usam tags e marcadores (ou seja, metadados) em vez de exigir um esquema predefinido em tabelas, linhas e colunas, como nos dados estruturados.
IV. Os data lakes podem ser projetados para armazenar dados semiestruturados juntamente com dados estruturados, permitindo a coexistência de dados de ambos os tipos.
Está correto o que se afirma em
1. Apache Kafka. 2. Apache Sqoop.
( ) Muito usado para transferência de dados entre bancos relacionais para o ecossistema Hadoop.
( ) Suas transferências de dados são baseadas em lotes, focando em transferências programadas ou sob demanda.
( ) Muito usado para streaming de dados em tempo real.
( ) Trabalha com mensageria distribuída, baseada no conceito de tópicos, permite que produtores enviem mensagens e consumidores as processem de forma assíncrona.
A associação correta, na ordem apresentada, é
Assinale a opção que apresenta, respectivamente, uma ferramenta que trata do modelo de dados orientado a colunas e outra, do modelo orientado a documentos.