Skip to the content.

Temario

  1. Introducción a Data Science
    • ¿Qué es Data Science?
    • Probabilidad básica, esperanza, varianza y correlación.
    • Ecuación de Demoivre, correlación y causalidad.
    • ¿Qué es Big Data?
    • Introducción a la visualización de datos
  2. Análisis exploratorio
    • Introducción a Pandas
    • Operaciones simples sobre Dataframes y Series
    • Visualización de datos con Matplotlib y Seaborn
    • Pandas avanzado: Paradigma split-apply-combine, groupby, transform, append, concat, merge
    • Pandas muy avanzado: manejo de memoria, stack, unstack, pivot & pivot table
  3. NLP I
    • Bag of Words (BOW)
    • TF-IDF
    • Stemming, Lemmatizing y Stopwords
  4. Compresión e IA:
    • Teoría de la información
    • Compresión sin pérdida
    • Complejidad de Kolmogorov
    • Inducción de Solomonoff
  5. Clase especial de análisis de datos
    • ETLs: airflow y armado de dashboards
    • Plotly
    • Tableau
  6. Spark
    • Teoría de map-reduce
    • API de RDDs
    • Transformaciones y acciones
    • Joins y broadcast joins
    • Estructuras de alto nivel
  7. Clase especial de spark: Pipelines avanzados de Spark con Airflow en Google Cloud
  8. Machine Learning:
    • Teoría de Machine Learning (bias-variance, overfitting, underfitting, hiperparámetros y parámetros)
    • Clasificación y Regresión
    • Métricas y Errores
    • Linear y logistic regression
    • KNN
    • Árboles, Random Forest y XGBoost
    • Feature Engineering
  9. Deep Learning:
    • Perceptrón
    • Teorema de aproximación universal y activaciones no lineales
    • Descenso por el gradiente y backpropagation
    • Aprendizaje profundo y sus aplicaciones
    • Algunas arquitecturas importantes
  10. NLP II:
    • Recurrent Neural Networks
    • Convoluciones 1D, Max pooling y Average pooling
    • Word embeddings
    • Fasttext
    • Char embeddings
  11. Reducción de dimensiones:
    • PCA/SVD
    • LSI
    • MDS y Laplacian Eigenmaps
    • t-SNE y uMAP
  12. Clustering
    • Clustering jerárquico
    • K-Means y K-Means online
    • Clustering espectral
    • DBScan y HDBScan
  13. Fairness
    • Ética, sesgo, discriminación, proxies y otras definciones
    • Sesgo estadístico
    • Calibración
    • El caso de COMPAS
    • Fairness
    • Group Fairness
    • Teoremas de imposibilidad de Fairness
    • Discriminación positiva: impacto en métricas
    • Fairness Tree
    • Redes neuronales adversariales para mitigar proxies
    • Individual Fairness