🧩 Unsupervised Learning - Clustering और Dimensionality Reduction (हिंदी में)
Unsupervised Learning वह तकनीक है जिसमें model को बिना किसी label के data से pattern और structure समझना सिखाया जाता है।
🔍 Unsupervised Learning क्या होता है?
Unsupervised Learning में कोई labeled output नहीं होता। Model खुद ही data के बीच के relationships को खोजता है। इसका मुख्य उद्देश्य hidden patterns और structures को पहचानना होता है।
इसके दो प्रमुख प्रकार हैं:
- Clustering — Grouping of similar data
- Dimensionality Reduction — Features की संख्या कम करना
📌 1. Clustering
Clustering में model data को ऐसे समूहों में बाँटता है जिनके भीतर की entries एक-दूसरे से मिलती-जुलती होती हैं।
Examples:
- Customer Segmentation
- Market Basket Analysis
- Image Segmentation
Popular Algorithms: K-Means, DBSCAN, Hierarchical Clustering
from sklearn.cluster import KMeans kmeans = KMeans(n_clusters=3) kmeans.fit(X) predicted_clusters = kmeans.labels_
📌 2. Dimensionality Reduction
जब data में बहुत सारी features होती हैं, तो model training slow और inaccurate हो सकती है। Dimensionality Reduction से हम features की संख्या घटा कर meaningful structure निकालते हैं।
Techniques:
- Principal Component Analysis (PCA)
- t-SNE (t-distributed Stochastic Neighbor Embedding)
from sklearn.decomposition import PCA pca = PCA(n_components=2) X_reduced = pca.fit_transform(X)
✅ निष्कर्ष
Unsupervised Learning models विशेष रूप से उपयोगी होते हैं जब हमारे पास labels नहीं होते। Clustering और Dimensionality Reduction दोनों AI में data understanding और preprocessing का महत्वपूर्ण हिस्सा हैं।
🚀 अगले ब्लॉग में: Feature Engineering Basics (Hindi में)