🧠 Computer Vision Basics - इमेज डेटा और चैनल्स (हिंदी में)
Computer Vision एक ऐसा क्षेत्र है जो मशीनों को इमेज और वीडियो को "देखने" और समझने की क्षमता देता है। AI और Deep Learning के साथ मिलकर यह फील्ड Face Recognition, Object Detection और Autonomous Vehicles जैसे अनेक क्षेत्र में उपयोगी है।
📷 इमेज डेटा क्या होता है?
हर इमेज बहुत सारे छोटे-छोटे squares से बनी होती है जिन्हें pixels कहते हैं। हर pixel के पास एक रंग होता है जो RGB (Red, Green, Blue) values से define होता है।
Pixel RGB Value Example: (120, 45, 210)
इन्हीं pixels की values को matrix या array के रूप में मॉडल में भेजा जाता है।
🌈 RGB Channels क्या होते हैं?
इमेज को हम 3 channels में बांटते हैं:
- Red Channel: सिर्फ लाल रंग की intensity
- Green Channel: हरे रंग की intensity
- Blue Channel: नीले रंग की intensity
Colored image = 3D array (Width x Height x 3)
🧾 इमेज का Data Format
Python में इमेज को OpenCV या PIL जैसे libraries से read किया जाता है:
import cv2 img = cv2.imread("image.jpg") print(img.shape) # Output: (Height, Width, Channels)
⚙️ ग्रेस्केल vs कलर इमेज
- Grayscale Image → सिर्फ एक channel (0-255 pixel value)
- Color Image → तीन channels (RGB)
Deep Learning में training के लिए कभी-कभी grayscale image ही पर्याप्त होती है।
✅ निष्कर्ष
Computer Vision की शुरुआत image data और RGB channels की समझ से होती है। यह जानकारी आपके deep learning मॉडल को image classify या detect करने में मदद करती है।
🚀 अगले ब्लॉग में: Image Preprocessing Techniques in Hindi