CNN Architecture Overview

Convolutions and pooling explained

🧠 CNN Architecture Overview - Convolution और Pooling Explained (हिंदी में)

CNN यानी Convolutional Neural Network deep learning का एक खास प्रकार है जो images को समझने, object detect करने और pattern पहचानने में बहुत उपयोगी होता है। यह architecture layered structure पर आधारित होता है जिसमें convolutions, pooling, activation और dense layers शामिल होते हैं।

🌀 1. Convolution Layer

Convolution layer image पर filters (या kernels) apply करता है ताकि features जैसे edges, textures और shapes को extract किया जा सके।

  • Filter size: आमतौर पर 3x3 या 5x5
  • Stride: Filter कितने steps में move करता है
  • Padding: Edge information बचाने के लिए
Conv_output = conv2d(input_image, filters=(3, 3), stride=1, padding='same')

📉 2. Pooling Layer

Pooling layer feature maps का size कम करता है और computational load घटाता है। सबसे common pooling है Max Pooling।

  • Max Pooling: Window में सबसे बड़ा value
  • Average Pooling: Window का average
  • Helps in: Translation Invariance
pool_output = max_pooling(conv_output, pool_size=(2, 2), stride=2)

⚡ 3. Activation Function (ReLU)

Non-linearity introduce करने के लिए ReLU (Rectified Linear Unit) सबसे commonly इस्तेमाल होता है।

relu_output = relu(pool_output)

ReLU सभी negative values को 0 कर देता है और positive values को unchanged छोड़ देता है।

🔗 4. Fully Connected Layer

यह layer features को flatten करके final prediction के लिए output units से connect करती है।

  • Classification tasks में सबसे आख़िरी step होता है
  • Softmax या Sigmoid activation से output generate होता है

✅ निष्कर्ष

CNN deep learning का एक मजबूत framework है जो खासकर computer vision के लिए design किया गया है। इसका architecture features को identify करके accurate prediction करने में मदद करता है।

🚀 अगले ब्लॉग में: Face Detection Techniques in Hindi