Mira el video introductorio



Las instructoras


Dra. Soledad Galli

Científica de Datos



Sole es científica de datos y desarroladora de software. Tiene experiencia en finanzas y seguros, recibió el premio Data Science Leaders Award en 2018 y fue seleccionada como "la voz de LinkedIn" en ciencia y análisis de datos en 2019. A Soledad le apasiona compartir conocimientos y ayudar a otros a tener éxito en la ciencia de datos.

Dra. Natalia Angarita

Científica de Datos



Natalia Angarita es científica de datos con más de 10 años de experiencia en el Reino Unido en sectores público, académico y privado cubriendo múltiples industrias como financiera, retail, viajes, gobierno, operaciones, salud, bio-medicina, entre otras. Ganadora del premio Ambition and Achievement Award, del Instituto de Ingeniería & Tecnología del Reino Unido.

Resumen


Aprende a modificar las variables en tus datos y construye mejores modelos de predicción.

Ya diste tus primeros pasos en ciencia de datos, ya conoces los modelos de predicción más usados, ya construiste alguna regresión lineal o algún árbol de predicción. Pero ahora, la vida real toca a tus puertas, y te das cuenta que los datos están sucios, les faltan valores, algunas variables tienen etiquetas en vez de números, no cumplen los supuestos de los modelos, un desastre! Y para peores, no encuentras muchas fuentes de conocimiento consolidadas al respecto. Solo blogs?

Este curso te va a ayudar! Este es el curso online más extenso y comprensivo en ingeniería de variables. Vas a aprender una enorme variedad de técnicas de ingeniaría usadas mundialmente en diferentes organizaciones, o en competiciones de ciencias de datos, para limpiar y transformar tus datos y variables.

Hemos juntado una recopilación de técnicas fantástica, luego de buscar, investigar e implementar métodos publicados en varias páginas online, artículos de publicación científica, artículos por organizaciones, y por supuesto, utilizando también nuestra experiencia como científicas de datos.


Específicamente, que vas a aprender?

  • Como imputar tus datos faltantes
  • Como codificar tus variables categóricas
  • Como transformar tus variables numéricas
  • Como convertir tus variables numéricas en intervalos discretos
  • Como remover datos atípicos
  • Qué hacer con variables de fechas y horarios
  • Como trabajar con diferentes zonas horarias
  • Qué hacer con variables mixtas

Vas a prender no una, sino múltiples técnicas que se pueden aplicar para cada uno de esos puntos. Y como si esto fuera poco, vas a aprender a implementar estas técnicas de manera elegante, eficiente, y profesional, utilizando Python, NumPy, pandas Scikit-learn y un paquete open-source especial que diseñamos especialmente para este curso: Feature-engine.

Al finalizar el curso, vas a poder ordenar todos tus pasos de ingeniería de variables en una pipeline simple y elegante, que te va a permitir poner tus modelos predictivos en producción de manera mucho más sencilla.


Necesitas saber más? Te contamos…

En el curso, vas a encontrar primero, las técnicas más utilizadas para ingeniería de variables, seguidas por técnicas más avanzadas y exclusivas, que capturan información, a la vez que codifican o transforman tus variables. Vas a encontrar también una explicación detallada de la técnica, que es lo que asume, cuales son las ventajas de su uso, así como también sus limitaciones, y luego, mejores prácticas de programación para implementarla en Python.

Este curso es apropiado para principiantes, pero también para estudiantes y practicantes intermedios y avanzados. Con seguridad, vas a encontrar alguna técnica dentro de nuestra colección, que te va a ser nueva y útil.

Con más de 100 lecciones individuales y 10 hs. de videos, este curso cubre casi todos los aspectos de ingeniería de variables, incluyendo técnicas de imputación de datos faltantes, técnicas de codificación de variables categóricas, transformación de variables numéricas, discretización, y trabajo con variables de fechas y tiempo.

En este curso, Python es el lenguaje que elegimos, por su simpleza y la cantidad de paquetes open-source que soportan la ingeniería de variables. Además creamos un paquete especial, Feature-engine, para que puedas aplicar todas estas técnicas en un puñado de líneas de código.

Entonces, que estás esperando? Súmate al curso, descubre el poder de una sólida ingeniería de variables, y construye mejores modelos de predicción.

Anotate!