Skip to the content.

TP3 - Machine Learning I

Dataset a usar

El dataset fue extraido por la cátedra para distintas canciones, y se encuentre acá.

El target a predecir es el género de la canción en la columna genre.

La métrica de validación es top-2 accuracy.

Parte I - Análisis Exploratorio (6 )

Deberán realizar 6 visualizaciones interesantes que ayuden a explicar o entender el target.

Parte II - Machine Learning Baseline (4 )

Vamos a construir un modelo muy sencillo para saber qué es lo peor que podemos hacer, en general esta es una tarea muy importante que queremos que repitan en sus proyectos de machine learning. ¿Por qué?

Utilice todas las columnas del dataset (exceptuando columnas que no tenga sentido usar para predecir) con algún encoding donde sea necesario para entrenar una regresión logística, utilizando búsqueda de hiperparametros y garantizando la reproducibilidad de los resultados cuando el notebook corriera varias veces. Conteste las preguntas:

Parte III - Machine Learning (10 )

Entrenar 2 (de tipos distintos, excluyendo regresiones logísticas) modelos (5 puntos cada uno) con búsqueda de hiperparametros (¿cómo conviene elegir los datos de validación respecto de los de train?). Los modelos deben cumplir las siguientes condiciones:

Puntos extra (hasta 4 )

Estas consignas suman puntos extra por fuera de los necesarios para aprobar el TP, mientras más consignas extra realicen más puntos consiguen y menos va a depender su aprobación de que los puntos de arriba estén bien:

Premio kahoot (un )

Utilizamos el promedio del puntaje normalizado de cada kahoot/parcialito para armar un podio. El podio se modificara a medida participen en los Kahoots. Los 5 primeros reciben un extra.

Padrón Alumno ML I ML II Redes neuronales Feature engineering Puntos Premio
108298 CHACON SALEMME 0.97 0.98 1 0.67 0.906087
108891 PELLEGRINI 0.93 0.73 0.77 1 0.856541
104084 GRZEGORCZYK 0.57 0.9 0.86 0.98 0.82853
105190 BARRETO 0.86 0.73 0.62 0.85 0.763124
107188 KIM 0.7 0.74 0.65 0.85 0.734401
97897 FERRERO 1 0.74 0.57 0.6 0.728648 -
105620 BOUCHARD 0.76 0.99 0.43 0.73 0.727996 -

Criterio de corrección

Se necesita un 60% (12/20) de los puntos para aprobar. Los puntos extra permiten sumar por dentro de los 20 (uno se puede sacar hasta 25 pero se sigue aprobando con 12 y el 20 representa un 10).

Criterio de reentrega

Se podrá reentregar el TP si el puntaje es >=8 y están todos los puntos desarrollados. La reentrega consiste en hacer un punto extra y corregir todos los puntos donde tuvieran menos de la mitad de los puntos.

Se aprueba la reentrega si todos los puntos tienen al menos la mitad de los puntos. En caso de luego aprobar la instancia de reentrega, la nota es siempre 4.

Parte I

Cada visualización vale un de los seis y debe cumplir con las siguientes condiciones:

Parte II

Vamos a corregir los siguientes puntos (no pueden restar más de 4 en total):

Parte III

Vamos a corregir los siguientes puntos en cada modelo de 5 puntos (a medida se acumulan estos pueden hacer que el modelo valga 0, pero nunca negativo):

Además si un modelo diera un resultado menor a 0,3 en validación se invalida entero. Por sobre el puntaje total del ejercicio (ambos modelos) se restan 3 puntos si cualquiera de las siguientes cosas suceden (no acumulables): eligen mal el mejor modelo entre los dos o la predicción para test no está bien hecha o la predicción en test da menos de 0,3.

Detalles y recomendaciones

Asignación de correctores

Padron Nombre Ayudante asignado
106870 ADRIS, MARIO SANTIAGO Matias Fusco y Gabriel Semorile
104498 ALMADA, FRANCO MARTIN Gianmarco Cafferata
106892 AMBOAGE, JUAN PATRICIO Esteban Djeordijan y Alejo Caliz Blanco
105190 BARRETO, SEVERINO Gianmarco Cafferata
108100 BENITO, AGUSTÍN Julieta Ponti y Martín Stefanelli
108225 BERENGUEL IBARRA, RAFAEL FRANCISCO Natalia Golmar
105620 BOUCHARD, JOSUE ALEJANDRO Gianmarco Cafferata
97640 BRONDO, FACUNDO LUCIO Damian Martinelli
106691 CAMPILLAY, EDGAR MATIAS Damian Martinelli
106359 CAMURRI, FEDERICO ALFREDO Damian Martinelli
108298 CHACON SALEMME, IGNACIO ALEJANDRO Esteban Djeordijan y Alejo Caliz Blanco
105907 CHEN, NICOLAS Matias Rotondo
99879 CLAROS CASTRO, ELVIS Luis Argerich
102868 CONTE GRAND, JOAQUIN Natalia Golmar
102104 COSTA, LUCIANO NIL: Nahuel Spieguelman, Ignacio Argel y Lucas Bilo
107963 CUEVAS, JUAN FRANCISCO Natalia Golmar
104098 CUPPARI, FRANCO Luis Argerich
101830 DE SANTIS, FEDERICO EZEQUIEL Gianmarco Cafferata
106368 DELLA VECCHIA, TOMAS NIL: Nahuel Spieguelman, Ignacio Argel y Lucas Bilo
107835 DEMARCHI, IGNACIO Natalia Golmar
105122 DIAZ CALIXTO, LUZ MILAGROS Luis Argerich
106308 DUCA, FRANCISCO Luis Argerich
106295 ENCINOZA VILELA, NATHALIA LUCIA Ignacio Brusati y Juan Pablo Fresia
105989 ERLICH, IVAN Esteban Djeordijan y Alejo Caliz Blanco
103992 ESPERON, RAMIRO Ignacio Brusati y Juan Pablo Fresia
106160 FABREGAS, ALEJO VALENTIN Ignacio Brusati y Juan Pablo Fresia
103740 FABREGAS, CAMILO EZEQUIEL Damian Martinelli
97261 FARFAN LENCINA, NICOLAS RAFAEL Natalia Golmar
97897 FERRERO, MANUEL Lucas Waisten
104354 GALIAN, TOMAS EZEQUIEL Esteban Djeordijan y Alejo Caliz Blanco
105043 GARCIA PIZALES, IGNACIO Matias Rotondo
105552 GENERAL, CAMILA Luis Argerich
101185 GOIJMAN, LAUTARO ENZO NIL: Nahuel Spieguelman, Ignacio Argel y Lucas Bilo
104503 GORDYN BIELLO, GONZALO Matias Fusco y Gabriel Semorile
104084 GRZEGORCZYK, IVAN Ignacio Brusati y Juan Pablo Fresia
107404 HURTADO VARGAS, DANIEL ALEJANDRO Natalia Golmar
107854 HUTTIN, FACUNDO TOMÁS Damian Martinelli
104424 Joel Isaac Fernandez Fox Luis Argerich
107188 KIM, DANIEL TOMAS Ignacio Brusati y Juan Pablo Fresia
103346 Lautaro Rodriguez Esteban Djeordijan y Alejo Caliz Blanco
100589 LEGUIZAMON, VERONICA BEATRIZ Luis Argerich
107825 LIN, CRISTIAN MARTIN Ignacio Brusati y Juan Pablo Fresia
105974 MACKE, FRANCO NIL: Nahuel Spieguelman, Ignacio Argel y Lucas Bilo
105645 MARIÑO, ALEJO TOMÁS Esteban Djeordijan y Alejo Caliz Blanco
101186 Mauro Giampietri Matias Fusco y Gabriel Semorile
108294 MAURO, CAROLINA LUCIA NIL: Nahuel Spieguelman, Ignacio Argel y Lucas Bilo
101769 MEDELA, MARIANO TOMAS Gianmarco Cafferata
103878 MEDONE SABATINI, JUAN IGNACIO NIL: Nahuel Spieguelman, Ignacio Argel y Lucas Bilo
108485 MENDAÑA, JOAQUÍN Natalia Golmar
107164 MORANDI, FABRIZZIO LEONARDO NIL: Nahuel Spieguelman, Ignacio Argel y Lucas Bilo
106016 Nicolás Vagó NIL: Nahuel Spieguelman, Ignacio Argel y Lucas Bilo
104881 OLANO SOLEY, NICOLÁS GUILLERMO Matias Fusco y Gabriel Semorile
0 Pablo Serrati Matias Fusco y Gabriel Semorile
103851 PANACCIO, GUIDO DANIEL Luis Argerich
108891 PELLEGRINI, ANTONELLA JAZMÍ­N Gianmarco Cafferata
91076 PORRAS CARHUAMACA, SHERLY KATERIN Natalia Golmar
108405 PORRO, JOAQUIN Damian Martinelli
91561 PRIETO, PABLO ALEJANDRO Matias Rotondo
105167 REGAZZOLI, IGNACIO Gianmarco Cafferata
104677 RIAL, TADEO EZEQUIEL Julieta Ponti y Martín Stefanelli
108267 RODRIGUEZ JUSTO, IGNACIO Gianmarco Cafferata
105318 RODRIGUEZ, TOMAS GUSTAVO Luis Argerich
103439 SAGMAN, EMANUEL NICOLAS Lucas Waisten
105637 SANTANDER, VALENTIN Lucas Waisten
103967 SCAZZOLA, LARA Julieta Ponti y Martín Stefanelli
106403 SCAZZOLA, MARTIN Natalia Golmar
102110 SCHEJTMAN, EZEQUIEL Gianmarco Cafferata
91979 SEDEK, JORGE IGNACIO NIL: Nahuel Spieguelman, Ignacio Argel y Lucas Bilo
98911 TEJELO, FERNANDO MARTIN Damian Martinelli
97819 TORRES, LUCAS GABRIEL Gianmarco Cafferata
103359 TOSONI MARQUEZ, FRANCO Matias Fusco y Gabriel Semorile