Skip to the content.

Guía de Clustering

Ejercicio 1

Dados los siguientes puntos: (1,2) (1,3) (1,5) (2,3) (2,8) (3,3) (4,1) (4,9) (7,8) (9,9) (12,2) (13,4)

Agrupar utilizando Clustering Jerárquico, indicando la cantidad de clusters resultantes y el criterio utilizado para definir dicho número. Representar el dendrograma mostrando como se agrupan los distintos elementos en los clusters obtenido.

Ejercicio 2

Se tienen los centroides \((0,0)\) y \((100, 40)\). Dados los siguientes puntos, indicar para cuál de ellos cambiaría el centroide al cual queda asignado según si se usa distancia Manhattan o Euclídea:

Ejercicio 3

Dados los siguientes puntos en dos dimensiones: \((5,1)\), \((5, 3)\), \((4, 4)\), \((9, 4)\), \((10, 3)\), \((11, 6)\)

Aplicar K-Means con centroides iniciales en \((8, 1)\) y \((7, 5)\).

Ejercicio 4

Sea los siguientes puntos en dos dimensiones:

Sobre estos puntos queremos usar K-Means, con la distancia euclídea, para encontrar 3 clusters. Sabemos que el resultado del algoritmo depende de la forma en la que elijamos los tres centroides iniciales. En base a esto responder:

Ejercicio 5

En cada uno de los siguientes casos sugiera que algoritmo de clustering usaría:

  1. 1000 puntos, 3 clusters de diferentes densidades y formas complejas.
  2. 1340 millones de puntos, 168 clusters de diferentes densidades y forma regular.
  3. 20.000 millones de puntos, no sabemos la cantidad de clusters, densidad variable y formas complejas.