Exploración de datos
5. Exploración de datos¶
La exploración de los datos es parte fundamental de la implementación de técnicas de aprendizaje automático, puesto que ayuda a escoger las herramientas adecuadas para resolver un problema en particular. En este capítulo, realizaremos una exploración de los datos usados en el trabajo: el conjunto R&D y BB1, descritos en la Sección 4.1.
En la primera sección, se mostrarán las distribuciones de los datos del conjunto R&D y el conjunto BB1 sin pre-procesar. Seguidamente, se presentarán las distribuciones y correlaciones de las variables obtenidas al pre-procesar los datos utilizando benchtools
. Por último, se analizarán los datos pre-procesados para UCluster y GAN-AE, algoritmos descritos en la Sección 4.3.