Skip to the content.

Guía de Machine Learning I

Ejercicio 1

Proponer datasets de train y de test y un modelo de regresión (entrenado sobre train) tal que el MSE en test sea 0.5 pero en train sea 0.

Ejercicio 2

Proponer datasets de train y de test tal que un KNN (entrenado sobre train) con k=3 clasifique mal más de la mitad de los puntos de test.

Ejercicio 3

Considerar los siguientes puntos en una dimensión y la clase a la que pertenece cada punto:

5-b, 10-b, 2-b, 6-a, 7-b, 8-b, 0-a, 13-b, 16-b, 1-a, 3-a, 17-b (el número es el valor de x, la letra es la clase a la que pertenece)

Se quiere usar KNN para clasificar los puntos con la distancia Manhattan. A fin de encontrar el valor óptimo de k (cantidad de vecinos) se decide usar cross-validation con folds de 4 registros, considerar los folds en el orden en que fueron presentados los puntos, es decir que el primer fold tiene (5-b,10-b,2-b,6-a).

Determinar el valor óptimo de “k” realizando grid-search para tres valores posiblesde k: 1,3 y 5. Usar precisión (accuracy) como métrica.