
हम इस पोस्ट में Structured Vs Unstructured Data की तुलना करके देखेंगे कि वे कैसे एक दूसरे से different हैं।
हर organization का सबसे महत्वपूर्ण पहलू data है। डेटा के कई रूप हो सकते हैं। यह टेक्स्ट, ग्राफिक्स और वीडियो सहित विभिन्न मीडिया में हो सकता है। अगर हम बात करें कि एक कॉलेज है तो वह कई प्रकार का डेटा हो सकता है। जैसे छात्र/कर्मचारी की जानकारी (text, number, date), वीडियो व्याख्यान (video lectures) (ऑडियो, वीडियो), ईमेल संचार, आदि।
हम प्रारूप के आधार पर डेटा को दो समूहों में अलग करते हैं।
- Structured Data
- Unstructured data
Table of Contents
What is Structured Data?
Structured data (संरचित डेटा) में विशिष्ट प्रारूप होता है जो रिलेशनल डेटाबेस सिस्टम (RDBMS) में संग्रहीत होता है। पारंपरिक row और column का उपयोग संरचित डेटा को संग्रहीत करने के लिए किया जाता है। संरचना डेटा में संख्या, वर्णानुक्रम, मुद्रा या दिनांक शामिल हो सकते हैं। संरचित डेटा के साथ काम करना अपेक्षाकृत आसान है
रिलेशनल डेटाबेस के साथ, हम संरचित क्वेरी भाषा (SQL) का उपयोग करके संरचित डेटा को query कर सकते हैं
Structured data में निश्चित फ़ील्ड होते हैं जो विशिष्ट डेटा की ओर इशारा करते हैं। उदाहरण के लिए नाम, फोन नंबर आदि। यदि आप इन सूचनाओं को आरडीबीएमएस शो में स्टोर करना चाहते हैं तो आपको डेटा के अनुरूप एक टेबल और कॉलम की आवश्यकता होगी। जब हम डेटा को RDBMS में स्टोर करते हैं तो हम डेटा के बीच संबंध स्थापित कर सकते हैं।
सरल तरीके से हम कह सकते हैं कि संरचित डेटा सुव्यवस्थित (well-organized) होता है।
What is Unstructured Data?
Unstructured Data (असंरचित डेटा), जैसा कि नाम से ही स्पष्ट है, सुव्यवस्थित नहीं है और इसका कोई पूर्व-निर्धारित प्रारूप नहीं है। जानकारी को उसके मूल स्वरूप (native format) में रखा जाता है। Unstructured जानकारी को स्टोर करने का कोई standard नहीं है। असंरचित डेटा टेक्स्टुअल या नॉन-टेक्स्टुअल हो सकते हैं, इंसानों या मशीनों द्वारा बनाया जा सकता है। असंरचित डेटा को व्यवस्थित करना और निकालना अधिक कठिन है।
आपने No-SQL डेटाबेस के बारे में तो सुना ही होगा। यह non-relational डेटाबेस होता है। आप Unstructured Data को No-SQL डेटाबेस में स्टोर कर सकते हैं।
टेक्स्ट फ़ाइलें, मीडिया, वेबसाइट, मोबाइल डेटा, उपग्रह चित्र और ईमेल असंरचित डेटा के उदाहरण हैं।
Differences between Structured and Unstructured Data
Structured Data (संरचित डेटा) | Unstructured Data (असंरचित डेटा) |
---|---|
संरचित डेटा वह डेटा होता है जो well defined और searchable होता है। | असंरचित डेटा अक्सर अपने native format में संग्रहीत किया जाता है, जिससे इसे manage करना और ढूंढना मुश्किल हो जाता है। |
संरचित डेटा rows और column में संग्रहीत किया जाता है | ऑडियो, टेक्स्ट और वीडियो फ़ाइलों के साथ-साथ NoSQL डेटाबेस का उपयोग असंरचित डेटा को संग्रहीत करने के लिए किया जाता है। |
संरचित डेटा को tabular फॉर्म में स्टोर करते हैं। जैसे की SQL डेटाबेस, excel शीट। | Natural language processing और text mining दोनों ही असंरचित डेटा का उपयोग करते हैं। |
संरचित डेटा को असंरचित डेटा की तुलना में कम storage space की आवश्यकता होती है। | असंरचित डेटा को संरचित डेटा की तुलना में अधिक storage space की आवश्यकता होती है। |
ऑनलाइन फॉर्म, जीपीएस सेंसर, नेटवर्क लॉग, वेब सर्वर लॉग, ओएलटीपी सिस्टम और अन्य स्रोत संरचित डेटा प्रदान करते हैं। | ईमेल संचार, वर्ड प्रोसेसिंग दस्तावेज़, पीडीएफ फाइलें और अन्य असंरचित डेटा स्रोतों का उपयोग किया जाता है। |
संरचित डेटा खोजना और उसका विश्लेषण करना सरल है। | असंरचित डेटा की व्याख्या और समझने के लिए अधिक प्रयास की आवश्यकता होती है। |
Structured Vs Unstructured Data Examples
Example of Structured Data
EMPNO | EMP NAME | HIREDATE | SALARY |
---|---|---|---|
1 | SCOTT | 01-MAY-1990 | 40000 |
2 | WARD | 08-SEP-2000 | 50000 |
3 | ADAMS | 23-MAY-1999 | 90000 |
4 | SMITH | 17-DEC-2015 | 45800 |
5 | TURNER | 09-JUN-2018 | 100000 |
Example of Unstructured Data
PDF, JPG, MPEG, .mp3 etc.
यह भी पढ़ें:
DBMS क्या है हिंदी में?
Oracle डेटाबेस में Join Query
Acid Properties in database management system (DBMS)