🧹 Image Preprocessing - Resize, Normalize और Enhance करना (हिंदी में)
Deep Learning मॉडल को train करने से पहले image को एक standard format में लाना आवश्यक होता है। इसी प्रक्रिया को Image Preprocessing कहा जाता है। यह performance और accuracy दोनों को बेहतर बनाता है।
📏 1. Image Resize करना
मॉडल को हर इमेज एक ही आकार में चाहिए ताकि वह समान input पर काम कर सके। उदाहरण:
import cv2 img = cv2.imread("image.jpg") resized = cv2.resize(img, (224, 224))
Common sizes: 224x224, 256x256 (ImageNet मॉडल्स के लिए)
⚖️ 2. Normalization
हर पिक्सेल का मान (0-255) को 0 से 1 या -1 से 1 के रेंज में स्केल करना Normalization कहलाता है। इससे gradient तेजी से converge करता है।
normalized = resized / 255.0
कुछ advanced मॉडल -1 से 1 के बीच normalization करते हैं।
🎨 3. Image Enhancement
Enhancement से हम image को बेहतर बनाते हैं ताकि मॉडल उसमें hidden patterns को जल्दी पहचान सके।
- Contrast बढ़ाना
- Sharpening
- Noise Reduction (Gaussian blur)
- Histogram Equalization (brightness संतुलन)
import cv2 image = cv2.imread("img.jpg") blurred = cv2.GaussianBlur(image, (5,5), 0)
📌 अन्य उपयोगी Steps
- Grayscale Conversion
- Data Augmentation (Flip, Rotate)
- Padding / Cropping
- CLAHE (Contrast Limited Adaptive Histogram Equalization)
✅ निष्कर्ष
Image Preprocessing एक जरूरी स्टेप है जो आपके deep learning मॉडल की performance को सीधे प्रभावित करता है। सही resize, normalize और enhancement से model ज़्यादा तेजी और accuracy से सीखता है।
🚀 अगले ब्लॉग में: CNN Architecture Overview (Hindi में)