Adatbányászat alapjai
Felügyelet nélküli módszerek
Prof. Dr. Kovács László diái alapján
Kunné Dr. Tamás Judit�2024/25/2
Klaszterezés
Példa klaszterezés feladatra
Hierarchikus klaszterezés
Hierarchikus klaszterezés
Dendrogram
Összevonó megközelítés fajtái
Klaszter távolságának meghatározása alapján
K-means (k-közép)
Iteratív újrapozicionálás
K-means clustering
Frissítés
K-means
Kiértékelés
K-means
Klaszter jósága
Könyök (Elbow) módszer
K-means Python kód
import numpy as np import pandas as pd
from matplotlib import pyplot as plt
from sklearn.datasets.samples_generator import make_blobs from sklearn.cluster import KMeans
X, y = make_blobs(n_samples=300, centers=6, cluster_std=0.60, random_state=0) plt.scatter(X[:,0], X[:,1])
plt.show() wcss = []
for i in range(1, 11):
kmeans = KMeans(n_clusters=i, init='k-means++', max_iter=300, n_init=10, random_state=0)
kmeans.fit(X) wcss.append(kmeans.inertia_)
plt.plot(range(1, 11), wcss) plt.title('Elbow Method') plt.xlabel('Number of clusters') plt.ylabel('WCSS')
plt.show()
kmeans = KMeans(n_clusters=4, init='k-means++', max_iter=300, n_init=10, random_state=0)
pred_y = kmeans.fit_predict(X) plt.scatter(X[:,0], X[:,1])
plt.scatter(kmeans.cluster_centers_[:, 0], kmeans.cluster_centers_[:, 1], s=300, c='red')
plt.show()
RapidMiner
RapidMiner
SOM klaszterezés (Self-organizing Map)
Adat reprezentálására
SOM klaszterezés
Algoritmus
SOM
SOM clustering
K-medoid
Társítási szabályok keresése
Feltárt szabályok:
{Tej} --> {Kóla}
{Pelenka, Tej} --> {Sör}
Példa társítási szabály keresés feladatra
Szekvenciális mintázatok keresése
Példa szekvenciális minta keresésésre
(Egyenirányító_riadó) --> (Tűz_riadó)
(Bevezetés_a_Visual_C_be) (Bevezetés_C++_ba) --> (Perl_kezdőknek, Tcl_Tk_nyelv)
(Cipő) (Teniszütő, Teniszlabda) --> (Sport_dzseki)
(Kamera) -> (64GB_SD_kártya)