Na etapa de preparação de dados a serem submetidos
ao processo de data mining, uma importante tarefa consiste no processo de normalização dos dados numéricos.
Com isso, leva-se o conjunto de dados a uma mesma
escala, evitando distorções na execução dos algoritmos
de aprendizado de máquina utilizados na descoberta de
conhecimento de dados e, com isso, afetando a análise
dos resultados.
Seja então um atributo numérico A com n valores observados {v
1
, v
2
, ... , v
n
}, média
![Imagem associada para resolução da questão](https://arquivos.qconcursos.com/images/provas/56876/c447ce29e2d4d7f73a53.png)
e desvio-padrão σ
A.
Nesse contexto, a técnica de normalização de dados que
gera
![Imagem associada para resolução da questão](https://arquivos.qconcursos.com/images/provas/56876/c65f0da83726c119a04b.png)
, dado um valor vi
ϵ A , é a