Estatística descritiva: representação tabular e gráfica, medidas de tendência central e dispersão. Probabilidade: definições e teoremas; variáveis aleatórias e distribuição de probabilidade; variância e covariância; correlação linear simples; distribuição binomial, normal, quiquadrado, t de Student e F; noções de amostragem e inferência estatística. Gestão de dados: DAMADMBOK. Linguagens de programação aplicadas ao tratamento de dados: Python, linguagem R e Matlab. Big data: fundamentos; tecnologia; gerenciamento; big data analítico; implementação; soluções reais. Técnicas de preparação e apresentação de dados: ETL (extração, transformação e carga); limpeza; importação; conversão; carga; visualização. Business Intelligence: conceitos; data warehouse; OLAP; MOLAP; ROLAP e OLTP; ferramentas e softwares. Mineração de dados: conceitos; técnicas; algoritmos; implementação e aplicação. Inteligência artificial: conceitos e aplicações. Aprendizado de Máquina: fundamentos básicos; algoritmos de aprendizado (supervisionado, não-supervisionado, por reforço); classificação e regressão; sistemas de recomendação; redes neurais artificiais; deep learning (noções); processamento de linguagem natural (noções). Banco de dados sistemas gerenciadores: SQL Server; Oracle; Postgre-SQL. Bancos de dados não relacionais: MongoDB, Cassandra. Linguagem SQL: SQL ANSI. Variantes de linguagem SQL: PL-SQL, T-SQL, PL/pqSQL, SQL/PSM. Legislação específica: Instrução Normativa nº 01/2019 – SEGES/ME; Lei nº 13.709/2018 (Lei geral de proteção de dados pessoais) e suas alterações.