Pig में डेटा प्रकार और Pig चलाने की प्रक्रिया - Data Types in Pig & Running Pig in Hindi


Pig में डेटा प्रकार और Pig चलाने की प्रक्रिया (Data Types in Pig & Running Pig in Hindi)

Apache Pig एक शक्तिशाली Big Data प्रोसेसिंग टूल है, जो Hadoop पर कार्य करता है। Pig Pig Latin नामक स्क्रिप्टिंग भाषा का उपयोग करता है, जो डेटा प्रोसेसिंग को सरल बनाता है। इस ब्लॉग में, हम Pig के डेटा प्रकार (Data Types) और Pig चलाने की प्रक्रिया (Running Pig) को विस्तार से समझेंगे।

1. Pig में डेटा प्रकार क्या हैं? (What are Data Types in Pig?)

Pig में डेटा प्रकार मुख्य रूप से दो श्रेणियों में विभाजित होते हैं:

  • प्रारंभिक डेटा प्रकार (Primitive Data Types)
  • संरचित डेटा प्रकार (Complex Data Types)

2. Pig के प्रारंभिक डेटा प्रकार (Primitive Data Types in Pig)

Primitive डेटा प्रकार वे डेटा प्रकार होते हैं जो व्यक्तिगत मूल्यों को संग्रहीत करते हैं।

3. Pig के संरचित डेटा प्रकार (Complex Data Types in Pig)

Complex डेटा प्रकार वे होते हैं जो एकाधिक डेटा मूल्यों को एक ही डेटा प्रकार में संग्रहीत करते हैं।

4. Pig में डेटा प्रकार कैसे उपयोग करें? (How to Use Data Types in Pig?)

student_data = LOAD 'hdfs://user/data/students.csv' USING PigStorage(',') 
AS (id:int, name:chararray, age:int, marks:bag{T:(subject:chararray, score:int)});
DUMP student_data;

5. Pig को कैसे चलाएँ? (How to Run Pig?)

i) स्थानीय मोड (Local Mode)

pig -x local

ii) MapReduce मोड (MapReduce Mode)

pig -x mapreduce

iii) इंटरैक्टिव मोड (Grunt Shell)

grunt>

6. Pig स्क्रिप्ट कैसे चलाएँ? (How to Execute Pig Script?)

i) Pig स्क्रिप्ट बनाना

student_data = LOAD 'hdfs://user/data/students.csv' USING PigStorage(',') 
AS (id:int, name:chararray, age:int, marks:int);
filtered_data = FILTER student_data BY age > 18;
DUMP filtered_data;

ii) Pig स्क्रिप्ट चलाना

pig -x mapreduce script.pig

7. Pig बनाम SQL (Pig vs SQL)

Pig और SQL दोनों डेटा प्रोसेसिंग टूल्स हैं, लेकिन Pig Big Data प्रोसेसिंग में और SQL रिलेशनल डेटा प्रोसेसिंग में काम आता है।

8. निष्कर्ष (Conclusion)

Apache Pig Big Data प्रोसेसिंग के लिए एक शक्तिशाली टूल है, जो Hadoop के साथ काम करता है। इसमें Primitive और Complex डेटा प्रकार होते हैं, जो इसे पारंपरिक SQL से अधिक फ्लेक्सिबल बनाते हैं। Pig को Local Mode, MapReduce Mode, और Grunt Shell में चलाया जा सकता है।

Related Post

Comments

Comments