Datos y métodos
4. Datos y métodos¶
Las olimpiadas del LHC 2020 representan un punto de partida para estudiar el uso de aprendizaje automático en búsquedas BSM libres de modelo. Los datos publicados y los algoritmos participantes proporcionan un amplio espectro de posibles investigaciones sobre el uso de estas herramientas para buscar anomalías en HEP. Este trabajo tiene como objetivo comparar directamente algoritmos de las LHCO 2020 y algoritmos más sencillos utilizados para la tarea de clasificación de eventos, usando métricas de rendimiento asociadas a esta tarea.
En este capítulo, se explican en detalle los datos y métodos utilizados en esta investigación. En la Sección 4.1 se describen los conjuntos de datos de las LHCO 2020 y en la Sección 4.2 se describen los algoritmos sencillos para detección de anomalías. En la Sección 4.3 se explican los algoritmos escogidos de las LHCO 2020 y los criterios de selección utilizados. Luego, en la Sección 4.4, se resumen las métricas para comparar el rendimiento de los modelos y finalmente, en la Sección 4.5, se explican las herramientas contenidas en el paquete de software basado en Python benchtools
, desarrollado para el análisis que se realizará en los siguientes capítulos.