Información 2021.1 - UdeA¶
Esta es información para los matriculados en el curso ofrecido por el Departamento de Ingeniería de Sistemas, Facultad de Ingeniería, Universidad de Antioquia, Medellín.
2021 Semestre 1 - Universidad de Antioquia
Solicitar inclusión en el grupo de Microsoft Teams del curso.
Quizá necesites activar MS Teams en tu cuenta de la UdeA
REGISTRO DE GRUPOS DE PROYECTO (solo un registro por grupo)
Horario de clases¶
MARTES 10:00-12:00 JUEVES 10:00-12:00
Las sesiones se realizarán por Zoom a través del siguiente enlace
Grabaciones: Accede en este enlace al repositorio de grabaciones de las sesiones sincrónicas del curso.
NOTAS
Tienes que entrar con tu USUARIO DE LA UDEA. No serán admitidos usuarios desde otras direcciones de correo.
Durante las sesiones le daremos prioridad A LAS PREGUNTAS que se FORMULEN PREVIAMENTE por MS TEAMS en el canal llamado
preguntas para sesiones sincrónicas
en el orden en el que aparezcan.
Evaluación¶
10% (0.5 puntos) PROYECTO PRIMERA ENTREGA
50% (2.5 puntos) LABS
10% (0.5 puntos) AI4Everyone
30% (1.5 puntos) PROYECTO ENTREGA FINAL
Fechas de entregas¶
21/mar/2021 REGISTRO GRUPOS DE PROYECTO
04/abr/2021 LABS 1-2
18/abr/2021 PROYECTO ENTREGA 1
18/jul/2021 LABS 3-4
18/jul/2021 AI4Everyone
18/jul/2021 LABS 5-6
18/jul/2021 LAB 7
18/jul/2021 PROYECTO ENTREGA 2
Calendario oficial
1/mar/2021 Inicio de clases
17/jul/2021 Fin clases
19-24/jul/2021 Exámenes finales
26-31/jul/2021 Habilitación y validación
6/ago/2021 Terminación oficial
Proyecto¶
Tendrás que hacer un proyecto de analítica de datos para el cual deberás:
Definir un problema predictivo
Obtener un dataset para resolverlo
Realizar el preprocesado y limpieza de datos
Encontrar los mejores hiperparámetros para DOS algoritmos predictivos
Encontrar los mejores hiperparámetros para DOS combinaciones de algoritmo no supervisado + algoritmo predictivo
Realizar las curvas de aprendizaje para cada uno de los cuatro casos anteriores
Realizar una evaluación diagnóstica que contenga:
Para cada uno de los cuatro casos anteriores un diagnóstico de overfitting/bias etc.
Una recomendación justificada de qué pasos a seguir si tuvieras que intentar mejorar el desempeño obtenido.
Una evaluación sobre los retos y condiciones para desplegar en producción un modelo (como establecerías el nivel de desempeño mínimo para desplegar en producción, cómo se desplegaría en producción, cómo serían los procesos de monitoreo del desempeño en producción)
Podrá hacerse individual o formarse grupos de 2 o 3 estudiantes
Recomendaciones¶
Te recomendamos que:
Mires en www.kaggle.com por ideas si no sabes qué hacer.
Verifiques que los datos están disponibles antes de escoger tu proyecto.
Estimes los requerimientos computacionales para generar los modelos que necesites. Reduce el alcance de tu proyecto si lo necesitas (menos datos, menos clases, etc.).
Realices una primera iteración cuanto antes. Es decir, que llegues a tener un primer modelo sencillo produciendo predicciones. Implementa en esta primera iteración estrictamente lo que necesites para tener un modelo. El objetivo es resolver la mayoría de los problemas técnicos que te puedan surgir para ya, después, enfocarte en todo lo que quieras hacer en las siguientes iteraciones (preprocesado de datos, otros modelos, etc.)
Entregas del proyecto¶
Tendrás que hacer dos entregas del proyecto:
ENTREGA 1: Un archivo llamado PROYECTO_FASE1.pdf en el que (1) describas el problema predictivo a resolver, (2) el dataset que vas a utilizar, (3) las métricas de desempeño requeridas (de machine learning y de negocio); y (4) un primer criterio sobre cual sería el desempeño deseable en producción.
Dos ejemplos del punto (4) anterior:
Ejemplo 1: nuestro modelo de predicción de la patología X en pacientes debería de tener un porcentaje de acierto >80%, pero también un false negative rate <5%, ya que es una patología grave y es preferible no fallar una detección de un paciente que verdaderamente tiene la patología, aunque eso implique que aumente el número de falsos positivos.
Ejemplo 2: según el departamento de marketing de cierta empresa, un modelo de predicción del siguiente producto que compre un cliente debería de tener un porcentaje de acierto de al menos 50%, ya que se usará el modelo para sugerir recomendaciones a los usuarios. Si el porcentaje de acierto es menor sería contraproducente porque perderíamos ventas.
Como en cualquier proyecto de analítica, esto supone un primer criterio, que probablemente se refine o modifique según se avanza en el proyecto, se entiende mejor el posible desempeño de los modelos, con el cliente se va definiendo cómo se usan los modelos en producción/operación, etc.
ENTREGA 2: Un archivo llamado PROYECTO_FASE2.pdf en el que describas el resto de la ejecucióndel proyecto, con la evidencia necesaria. Tendrás que incluir una carpeta llamada PROYECTO_FASE2_MATERIALES donde incluyas todas las herramientas necesarias para reproducir los resultados que obtuviste (muestras de los datasets, notebooks, instrucciones de uso de las herramientas que hayas usado, etc.)
TODAS LAS ENTREGAS HAN DE DEPOSITARSE EN LA CARPETA DRIVE DE CADA ESTUDIANTE.
AI for Everyone¶
Deberás de completar el curso AI for Everyone y hacer un resumen del mismo. El resumen deberá contener:
tres páginas como máximo
un párrafo por cada módulo del curso que decriba los puntos más importantes del mismo
un pantallazo en el que se vea que has visualizado los videos
una apreciación por tu parte acerca de la aplicabilidad de lo visto en el curso en proyectos relacionados con tu área de conocimiento.
Deberás de depositar el resumen en un fichero llamado RESUMEN_AI4EVERYONE.pdf en la carpeta compartida del curso.
EL NOMBRADO DE ARCHIVOS ES ESTRICTO¶
CUALQUIER ARCHIVO CON UN NOMBRE DISTINTO SERÁ IGNORADO, AUNQUE SEA ENTREGADO ANTES DE LAS FECHAS LÍMITE