Skip to content

Instantly share code, notes, and snippets.

@thinkphp
Last active January 19, 2026 06:34
Show Gist options
  • Select an option

  • Save thinkphp/a934cac097befb108a7738df00ccb586 to your computer and use it in GitHub Desktop.

Select an option

Save thinkphp/a934cac097befb108a7738df00ccb586 to your computer and use it in GitHub Desktop.

Ce este Inerția în KMeans?

Inertia (inertia/within-cluster sum of squares - WCSS) este o metrică care măsoară cat de compacte sunt clusterele în modelul KMeans.

Definitie matematica:

Inertia = suma distanțelor patratice dintre fiecare punct și centroidul clusterului său

Inerție = Σ ||xᵢ - cₖ||²

unde:
- xᵢ = un punct de date
- cₖ = centroidul clusterului k
- ||...||² = distanța pătrată (euclidiană)

Explicație simplă:

Imaginează-ți că ai 3 grupuri de jucători NBA:

  • Grup 1: Jucători care aruncă puțin de la 3 puncte
  • Grup 2: Jucători moderați la 3 puncte
  • Grup 3: Specialiști la 3 puncte

Fiecare grup are un centroid (punctul central/media grupului).

Inerția măsoară: Cât de departe sunt jucătorii de centrul grupului lor?

Inerție MICĂ = BUN

  • Jucătorii sunt aproape de centrul grupului lor
  • Clusterele sunt compacte și omogene
  • Jucătorii din același grup sunt similari între ei

Inerție MARE = RĂU

  • Jucătorii sunt răspândiți departe de centru
  • Clusterele sunt difuze și neomogene
  • Jucătorii din același grup sunt foarte diferiți

Exemplu vizual:

Cluster COMPACT (inerție mică):    Cluster DIFUZ (inerție mare):
        ●                                  ●
      ● X ●                            ●       ●
        ●                          ●      X        ●
                                       ●       ●
(X = centroid)

Exemplu practic NBA:

Să zicem că ai un cluster cu 3 jucători:

Jucător A: 100 aruncări 3P
Jucător B: 110 aruncări 3P
Jucător C: 105 aruncări 3P
Centroid: 105 aruncări 3P

Inerția = (100-105)² + (110-105)² + (105-105)²
Inerția = 25 + 25 + 0 = 50 (inerție mică - cluster compact!)

Dacă ar fi fost:

Jucător A: 50 aruncări 3P
Jucător B: 200 aruncări 3P
Jucător C: 100 aruncări 3P
Centroid: ~117 aruncări 3P

Inerția ar fi fost mult mai mare - jucătorii sunt foarte diferiți!

De ce este importantă?

  1. KMeans încearcă să minimizeze inerția - caută cea mai bună grupare
  2. Compară modele diferite - model cu inerție mai mică = grupare mai bună
  3. Curba Elbow folosește inerția pentru a găsi numărul optim de clustere
  • Inerția scade mereu când adaugi mai multe clustere
  • Cu K = număr de puncte → inerția = 0 (dar e inutil!)
  • De aceea folosim curba Elbow - pentru echilibru între inerție mică și număr rezonabil de clustere
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment