Oferta Académica
Seminario
Seminario fundamentos de aprendizaje automático-machine learning con scikit-learn
- Transformación Digital, Ingeniería de Datos y TIC´S
-
Remoto
- Inicia el 31 de marzo de 2025
-
24 horas
Inversión |
$520.000 |
Horarios |
Lunes y miércoles 6:00pm a 9:00pm
|
duración | 4 semanas |
intensidad | 24 horas |
Facultad | Escuela de Ingeniería, Ciencia y Tecnología |
Objetivo
Dotar al estudiante de habilidades para implementar y optimizar modelos de aprendizaje automático mediante scikit-Learn
Dirigido a
• Estudiantes y profesionales en Ciencias de la Computación, que buscan especializarse en aprendizaje automático.
• Analistas y Científicos de Datos, que busquen mejorar sus habilidades en modelado predictivo y clasificación.
• Ingenieros y profesionales afines que desean incursionar en Inteligencia Artificial.
• Profesionales en finanzas, salud y marketing, que buscan aplicar análisis predictivo en su trabajo.
• Investigadores académicos en IA, interesados en fortalecer sus habilidades prácticas.
- Implementar técnicas de clasificación y regresión, como SVM y regresión lineal/múltiple, para solucionar problemas prácticos.
- Aplicar métodos de "ensemble learning" y reducción de dimensionalidad para optimizar y adaptar modelos a grandes conjuntos de datos.
- Diseñar soluciones basadas en aprendizaje no supervisado, como clustering y detección de anomalías, para abordar retos con datos sin etiquetar.
Módulo 1.
Introducción y Pasos en un Proyecto de Aprendizaje Automático: Definición, propósito y problemas que el aprendizaje automático busca resolver. Categorías principales y conceptos fundamentales de sus sistemas. Descripción general de los pasos típicos en un proyecto de aprendizaje automático.
Módulo 2.
Clasificación: Abordaremos las tareas de aprendizaje supervisado, centrándonos en la clasificación (predicción de clases). Se realizará una revisión de los sistemas de clasificación mediante el análisis de ejemplos con scikit-Learn
Módulo 3.
Regresión Lineal, regresión múltiple: En este módulo, abordamos los modelos de aprendizaje automático y sus algoritmos de entrenamiento, priorizando la regresión lineal y múltiple. Aunque muchas veces se utilizan como cajas negras, entender su funcionamiento interno permite seleccionar el modelo adecuado, el algoritmo de entrenamiento correcto y un conjunto óptimo de hiperparámetros. Se exploran dos métodos para entrenar la regresión lineal: mediante una ecuación de "forma cerrada" y mediante el enfoque de optimización iterativa llamado descenso del gradiente. Posteriormente, se introduce la regresión polinómica, que aborda conjuntos de datos no lineales y técnicas de regularización para evitar el sobreajuste. El módulo concluye con una breve introducción a la regresión logística y softmax, todo ello implementado con scikit-Learn.
Módulo 4.
SVM: Support Vector Machine(SVM, por sus siglas en inglés) es un modelo versátil y potente de aprendizaje automático, apto para realizar clasificación lineal o no lineal, regresión e incluso detección de novedades. Las SVMs son especialmente efectivas en conjuntos de datos pequeños a medianos de carácter no lineal, principalmente para tareas de clasificación. Sin embargo, no se adaptan eficientemente a conjuntos de datos muy grandes. En este módulo, abordaremos los conceptos esenciales de las SVMs, su uso y su funcionamiento, todo ello a través de ejemplos prácticos utilizando scikit-learn
Módulo 5.
Arboles de decisión: Los árboles de decisión son algoritmos versátiles de aprendizaje automático que pueden realizar tareas de clasificación y regresión, e incluso tareas de múltiples salidas. Son algoritmos poderosos, capaces de adaptarse a conjuntos de datos complejos. En este módulo, comenzaremos discutiendo cómo entrenar, visualizar y realizar predicciones con árboles de decisión utilizando scikit-learn. Luego, abordaremos el algoritmo de entrenamiento CART, exploraremos cómo regularizar árboles y cómo utilizarlos para tareas de regresión. Finalmente, discutiremos algunas de las limitaciones de los árboles de decisión
Módulo 6.
Ensemble Learning y Random Forest: El "ensemble Learning" aprovecha la sabiduría colectiva, combinando múltiples predictores para mejorar la precisión en tareas de aprendizaje automático. Es similar a consultar a miles de personas para obtener una respuesta más acertada. En este tema, exploraremos técnicas de ensemble, como "random forests", clasificadores de votación y "boosting", y cómo implementarlas con scikit-learn. Estos métodos, al agrupar diferentes algoritmos, potencian las predicciones y son esenciales en proyectos avanzados
Módulo 7.
Reducción de la dimensionalidad: El enfrentar problemas con miles o millones de características puede llevar a la "maldición de la dimensionalidad", complicando y ralentizando el proceso de aprendizaje automático. Afortunadamente, es posible reducir estas características, facilitando y agilizando la tarea. La reducción de dimensionalidad no sólo acelera el entrenamiento, sino que es crucial para la visualización de datos, facilitando la identificación de patrones y la comunicación efectiva de los resultados. En este módulo, exploraremos técnicas de reducción de dimensionalidad, como PCA, proyección aleatoria y LLE, y cómo implementarlas con scikit-learn para optimizar el aprendizaje automático.
Módulo 8.
Técnicas de aprendizaje automático no supervisado: El aprendizaje no supervisado brinda la posibilidad de trabajar con datos no etiquetados, una realidad en muchas aplicaciones actuales de aprendizaje automático. En lugar de depender de etiquetas manuales costosas y laboriosas, este enfoque se centra en tareas como el agrupamiento de instancias similares, la detección de datos inusuales y la estimación de la densidad de un conjunto de datos. En este módulo, utilizando scikit-learn, abordaremos estos conceptos esenciales, proporcionando herramientas prácticas para situaciones del mundo real.
Conoce a tus profesores
PhD en Química con amplia experiencia en el uso de métodos avanzados de simulación y técnicas de análisis de datos en entornos de HPC, así como en el diseño, manejo y gestión de bases de datos mediante lenguajes de programación como Python, C/C++ y SQL. Con profundo interés en la quimio informática, que es un campo interdisciplinario que se enfoca en la aplicación de métodos informáticos para analizar y comprender datos químicos y biológicos, incluyendo la modelización de estructuras moleculares.
Contacta a nuestro asesor
Ingrid Lorena Triana P.
(601) 2970200 Ext 3182 / 313 333 12 58
Educación informal, no conducente a título alguno o certificado de aptitud ocupacional. Certifica asistencia.
La Universidad del Rosario se reserva el derecho de modificar el programa o el equipo docente publicado.
Oferta Académica
Seminario
Seminario fundamentos de aprendizaje automático-machine learning con scikit-learn
Te ayudamos a cumplir tus
sueños con nuestras opciones
de descuentos
Línea de atención
(+57) 601 297 0200 Opción 6
¿QUIERES ESTE PROGRAMA PARA TU EMPRESA?
quiero más información