Información 2021.1 - UdeA

Esta es información para los matriculados en el curso ofrecido por el Departamento de Ingeniería de Sistemas, Facultad de Ingeniería, Universidad de Antioquia, Medellín.

2021 Semestre 1 - Universidad de Antioquia

Horario de clases

    MARTES 10:00-12:00          JUEVES 10:00-12:00

Las sesiones se realizarán por Zoom a través del siguiente enlace

https://udea.zoom.us/j/95023653667

Grabaciones: Accede en este enlace al repositorio de grabaciones de las sesiones sincrónicas del curso.

NOTAS

  • Tienes que entrar con tu USUARIO DE LA UDEA. No serán admitidos usuarios desde otras direcciones de correo.

  • Durante las sesiones le daremos prioridad A LAS PREGUNTAS que se FORMULEN PREVIAMENTE por MS TEAMS en el canal llamado preguntas para sesiones sincrónicas en el orden en el que aparezcan.

Evaluación

10% (0.5 puntos) PROYECTO PRIMERA ENTREGA
50% (2.5 puntos) LABS
10% (0.5 puntos) AI4Everyone
30% (1.5 puntos) PROYECTO ENTREGA FINAL

Fechas de entregas

    21/mar/2021    REGISTRO GRUPOS DE PROYECTO
    04/abr/2021    LABS 1-2
    18/abr/2021    PROYECTO ENTREGA 1
    18/jul/2021    LABS 3-4
    18/jul/2021    AI4Everyone
    18/jul/2021    LABS 5-6
    18/jul/2021    LAB 7
    18/jul/2021    PROYECTO ENTREGA 2

Calendario oficial

    1/mar/2021  Inicio de clases
   17/jul/2021  Fin clases
19-24/jul/2021  Exámenes finales
26-31/jul/2021  Habilitación y validación
    6/ago/2021  Terminación oficial

Proyecto

Tendrás que hacer un proyecto de analítica de datos para el cual deberás:

  1. Definir un problema predictivo

  2. Obtener un dataset para resolverlo

  3. Realizar el preprocesado y limpieza de datos

  4. Encontrar los mejores hiperparámetros para DOS algoritmos predictivos

  5. Encontrar los mejores hiperparámetros para DOS combinaciones de algoritmo no supervisado + algoritmo predictivo

  6. Realizar las curvas de aprendizaje para cada uno de los cuatro casos anteriores

  7. Realizar una evaluación diagnóstica que contenga:

    1. Para cada uno de los cuatro casos anteriores un diagnóstico de overfitting/bias etc.

    2. Una recomendación justificada de qué pasos a seguir si tuvieras que intentar mejorar el desempeño obtenido.

    3. Una evaluación sobre los retos y condiciones para desplegar en producción un modelo (como establecerías el nivel de desempeño mínimo para desplegar en producción, cómo se desplegaría en producción, cómo serían los procesos de monitoreo del desempeño en producción)

Podrá hacerse individual o formarse grupos de 2 o 3 estudiantes

Recomendaciones

Te recomendamos que:

  • Mires en www.kaggle.com por ideas si no sabes qué hacer.

  • Verifiques que los datos están disponibles antes de escoger tu proyecto.

  • Estimes los requerimientos computacionales para generar los modelos que necesites. Reduce el alcance de tu proyecto si lo necesitas (menos datos, menos clases, etc.).

  • Realices una primera iteración cuanto antes. Es decir, que llegues a tener un primer modelo sencillo produciendo predicciones. Implementa en esta primera iteración estrictamente lo que necesites para tener un modelo. El objetivo es resolver la mayoría de los problemas técnicos que te puedan surgir para ya, después, enfocarte en todo lo que quieras hacer en las siguientes iteraciones (preprocesado de datos, otros modelos, etc.)

Entregas del proyecto

Tendrás que hacer dos entregas del proyecto:

  • ENTREGA 1: Un archivo llamado PROYECTO_FASE1.pdf en el que (1) describas el problema predictivo a resolver, (2) el dataset que vas a utilizar, (3) las métricas de desempeño requeridas (de machine learning y de negocio); y (4) un primer criterio sobre cual sería el desempeño deseable en producción.

Dos ejemplos del punto (4) anterior:

  • Ejemplo 1: nuestro modelo de predicción de la patología X en pacientes debería de tener un porcentaje de acierto >80%, pero también un false negative rate <5%, ya que es una patología grave y es preferible no fallar una detección de un paciente que verdaderamente tiene la patología, aunque eso implique que aumente el número de falsos positivos.

  • Ejemplo 2: según el departamento de marketing de cierta empresa, un modelo de predicción del siguiente producto que compre un cliente debería de tener un porcentaje de acierto de al menos 50%, ya que se usará el modelo para sugerir recomendaciones a los usuarios. Si el porcentaje de acierto es menor sería contraproducente porque perderíamos ventas.

Como en cualquier proyecto de analítica, esto supone un primer criterio, que probablemente se refine o modifique según se avanza en el proyecto, se entiende mejor el posible desempeño de los modelos, con el cliente se va definiendo cómo se usan los modelos en producción/operación, etc.

  • ENTREGA 2: Un archivo llamado PROYECTO_FASE2.pdf en el que describas el resto de la ejecucióndel proyecto, con la evidencia necesaria. Tendrás que incluir una carpeta llamada PROYECTO_FASE2_MATERIALES donde incluyas todas las herramientas necesarias para reproducir los resultados que obtuviste (muestras de los datasets, notebooks, instrucciones de uso de las herramientas que hayas usado, etc.)

TODAS LAS ENTREGAS HAN DE DEPOSITARSE EN LA CARPETA DRIVE DE CADA ESTUDIANTE.

AI for Everyone

Deberás de completar el curso AI for Everyone y hacer un resumen del mismo. El resumen deberá contener:

  • tres páginas como máximo

  • un párrafo por cada módulo del curso que decriba los puntos más importantes del mismo

  • un pantallazo en el que se vea que has visualizado los videos

  • una apreciación por tu parte acerca de la aplicabilidad de lo visto en el curso en proyectos relacionados con tu área de conocimiento.

Deberás de depositar el resumen en un fichero llamado RESUMEN_AI4EVERYONE.pdf en la carpeta compartida del curso.

EL NOMBRADO DE ARCHIVOS ES ESTRICTO

CUALQUIER ARCHIVO CON UN NOMBRE DISTINTO SERÁ IGNORADO, AUNQUE SEA ENTREGADO ANTES DE LAS FECHAS LÍMITE