टेक्स्ट फॉर्मेट की आवश्यकता क्यों है?

पाठ प्रारूप जानकारी संग्रहीत करने के लिए सुविधाजनक हैं क्योंकि उन्हें प्रोग्राम और मानव दोनों द्वारा बनाया और संसाधित किया जा सकता है।

पाठ फ़ाइलें (पाठ प्रारूप में फ़ाइलें) को विभिन्न प्रकार के पाठ संपादकों में खोला, पढ़ा और संपादित किया जा सकता है।

कई प्रोग्राम टेक्स्ट-आधारित कॉन्फ़िगरेशन फ़ाइलों का उपयोग करते हैं, भले ही प्रारूप में संख्याएँ और बाइनरी (हाँ/नहीं) मान हों।

यह पाठ से आंतरिक प्रारूप में और इसके विपरीत रूपांतरण की आवश्यकता के कारण प्रोग्राम को कुछ अधिक जटिल बना देता है, लेकिन यह प्रोग्राम में कॉन्फ़िगरेशन टूल का उपयोग किए बिना मैन्युअल रूप से कॉन्फ़िगरेशन को संपादित करना संभव बनाता है।

XML का उपयोग अब कहाँ किया जाता है?

XML का उपयोग आईटी के विभिन्न क्षेत्रों में किया जाता है। यह कॉन्फ़िगरेशन फ़ाइलें (प्रोग्राम सेटिंग्स के साथ) या प्रोग्राम के बीच डेटा स्थानांतरित करने के लिए उपयोग की जाने वाली फ़ाइलें हो सकती हैं। जावा में, सबसे आम उपयोग मामलों में से एक मावेन को कॉन्फ़िगर करना है, जो एक बिल्ड ऑटोमेशन टूल है।

XML दस्तावेज़ की संरचना

XML दस्तावेज़ की भौतिक और तार्किक संरचनाओं को अलग रखा जाता है। भौतिक संरचना के संदर्भ में, दस्तावेज़ में ऐसी संस्थाएँ होती हैं जो अन्य संस्थाओं को संदर्भित कर सकती हैं।

एकमात्र मूल तत्व दस्तावेज़ इकाई है। एक इकाई एक दस्तावेज़ में सबसे छोटा हिस्सा है। सभी संस्थाओं का एक नाम होता है और इसमें वर्ण होते हैं।

बदले में, वर्ण दो श्रेणियों में से एक होते हैं: वर्ण डेटा या मार्कअप।

मार्कअप में शामिल हैं:

  • टैग, जो तत्व सीमाओं को दर्शाता है;
  • घोषणाएं और प्रसंस्करण निर्देश, उनकी विशेषताओं सहित;
  • इकाई संदर्भ;
  • टिप्पणियाँ;
  • सीडीएटीए अनुभागों को लपेटने वाले चरित्र अनुक्रम।

तार्किक रूप से, दस्तावेज़ में तत्व, टिप्पणियाँ, घोषणाएँ, इकाई संदर्भ और प्रसंस्करण निर्देश शामिल हैं। किसी दस्तावेज़ में इस सभी संरचना को बनाने के लिए मार्कअप का उपयोग किया जाता है।

एक दस्तावेज़ के सभी घटक भागों को एक प्रस्तावना और एक मूल तत्व में विभाजित किया गया है। मूल तत्व एक XML दस्तावेज़ का अनिवार्य, आवश्यक हिस्सा है, जबकि प्रोलॉग बिल्कुल भी मौजूद नहीं हो सकता है। मूल तत्व में नेस्टेड तत्व, चरित्र डेटा और टिप्पणियाँ शामिल हो सकती हैं। एक दस्तावेज़ के तत्वों को सही ढंग से नेस्ट किया जाना चाहिए: कोई भी तत्व जो किसी अन्य तत्व के अंदर शुरू होता है, उस तत्व के अंदर भी समाप्त होना चाहिए।

मार्कअप प्रतीक

मार्कअप हमेशा < से शुरू होता है और > के साथ समाप्त होता है ।

< और > (कोण कोष्ठक) और & (एम्परसेंड) प्रतीक एक विशेष भूमिका निभाते हैं । कोण कोष्ठक तत्वों की सीमाओं, प्रसंस्करण निर्देशों और कुछ अन्य अनुक्रमों को इंगित करते हैं। और एंपरसेंड टेक्स्ट को संस्थाओं से बदलने में हमारी मदद करता है।

एक्सएमएल घोषणा

एक XML घोषणा दस्तावेज़ लिखने के लिए प्रयुक्त भाषा के संस्करण को निर्दिष्ट करती है। एक्सएमएल विनिर्देश एक दस्तावेज़ को एक्सएमएल घोषणा के साथ शुरू करने के लिए कहता है क्योंकि दस्तावेज़ सामग्री की उचित व्याख्या भाषा के संस्करण पर निर्भर करती है।

भाषा के पहले संस्करण (1.0) में, यह घोषणा वैकल्पिक थी, लेकिन बाद के संस्करणों में यह अनिवार्य है। एक लापता घोषणा को संस्करण 1.0 माना जाता है। घोषणा में दस्तावेज़ एन्कोडिंग के बारे में जानकारी भी हो सकती है।

उदाहरण:

<?XML संस्करण="1.1" एन्कोडिंग="UTF-8" ?>

टैग

एक टैग एक मार्कअप निर्माण होता है जिसमें एक तत्व का नाम होता है। स्टार्ट टैग और एंड टैग हैं। खाली-तत्व टैग भी हैं जो प्रारंभ और अंत तत्वों को जोड़ते हैं।

उदाहरण:

  • प्रारंभ टैग: <tag1>

  • अंतिम टैग: </tag1>

  • खाली-तत्व टैग: <empty_tag1 />

गुण

XML तत्वों का एक अन्य भाग विशेषताएँ हैं। एक तत्व में कई अनूठी विशेषताएँ हो सकती हैं। गुण हमें एक तत्व के बारे में अधिक जानकारी निर्दिष्ट करते हैं। या अधिक सटीक रूप से, विशेषताएँ तत्वों के गुणों को परिभाषित करती हैं।

एक विशेषता हमेशा एक नाम-मूल्य जोड़ी होती है:

नाम = "मान"

एक टैग में एक विशेषता का उदाहरण:

<tag1 नाम = "मूल्य">तत्व</tag1>

किसी विशेषता का मान दोहरे उद्धरण ( " ) या एकल उद्धरण ( ' ) में लपेटा जाना चाहिए। विशेषताएँ केवल प्रारंभ टैग और खाली-तत्व टैग में उपयोग की जाती हैं।

पाँच विशेष वर्णों से बचना (<, >, ', ”, &)

जाहिर है, चरित्र डेटा और विशेषता मूल्यों में < , > और & प्रतीकों का उपयोग नहीं किया जा सकता है। आपको उनका प्रतिनिधित्व करने के लिए विशेष एस्केप सीक्वेंस की आवश्यकता है। विशेषता मानों के अंदर एपोस्ट्रोफ और उद्धरण चिह्न लिखते समय विशेष अनुक्रमों का भी उपयोग किया जाता है:

प्रतीक प्रतिस्थापन
< <
> >
और &
' '
" "

साथ ही, \ वर्ण लिखने के लिए , आपको \\ का उपयोग करने की आवश्यकता है ।

सीडीएटीए अनुभाग

सीडीएटीए अनुभाग टेक्स्ट की तार्किक इकाई नहीं है। इस प्रकार का खंड हो सकता है जहां XML सिंटैक्स हमें दस्तावेज़ में वर्ण डेटा रखने देता है।

अनुभाग <![CDATA[ से शुरू होता है और ]]> से समाप्त होता है । मार्कअप के इन बिट्स के बीच कैरेक्टर डेटा रखा जाता है, और < , > , और & प्रतीकों का उपयोग उनके प्रत्यक्ष रूप में किया जा सकता है।

टिप्पणियाँ

टिप्पणियों को वर्ण डेटा नहीं माना जाता है। एक टिप्पणी <!-- से शुरू होती है और --> से समाप्त होती है । वर्ण क्रम -- किसी टिप्पणी के अंदर उपयोग नहीं किया जा सकता. इसके अलावा, एक टिप्पणी के अंदर, एम्परसेंड वर्ण मार्कअप को निरूपित नहीं करता है।

उदाहरण:

<!-- यह एक टिप्पणी है -->

नाम

एक्सएमएल में, सभी नामों में यूनिकोड वर्ण तालिका, अरबी अंक, अवधि, कोलन, हाइफ़न और अंडरस्कोर में केवल अक्षर हो सकते हैं। नाम एक अक्षर, कोलन या अंडरस्कोर से शुरू हो सकते हैं। ध्यान दें कि कोई नाम स्ट्रिंग XML से शुरू नहीं हो सकता है ।

उदाहरण

आइए एक जावा क्लास और उस क्लास के एक ऑब्जेक्ट को देखें। फिर हम ऑब्जेक्ट को XML फॉर्मेट में क्रमबद्ध करने का प्रयास करेंगे। कक्षा का कोड:


public class Book {
   private String title;
   private String author;
   private Integer pageCount;
   private List<String> chapters;

   public Book(String title, String author, Integer pageCount, List<String> chapters) {
       this.title = title;
       this.author = author;
       this.pageCount = pageCount;
       this.chapters = chapters;
   }
// Getters/setters
}

और वस्तुओं का निर्माण:


Book book = new Book("My Favorite Book", "Amigo", 999, Arrays.asList("Chapter 1", "Chapter 2", "Chapter 3", "Chapter 4", "Chapter 5", "Chapter 6"));

यहां जावा ऑब्जेक्ट के वैध एक्सएमएल प्रतिनिधित्व का एक उदाहरण दिया गया है जिसमें 4 फ़ील्ड शामिल हैं, जिनमें से एक संग्रह है (ऊपर जावा कोड देखें):

<पुस्तक>
  <शीर्षक>मेरी पसंदीदा पुस्तक</
  title> <author>अमीगो</author>
  <pageCount>999</pageCount>
 <अध्याय>
    <अध्याय>अध्याय 1</अध्याय> <
    अध्याय>अध्याय 2</अध्याय>
    <अध्याय>अध्याय 3</
    अध्याय> <अध्याय>अध्याय 4</अध्याय>
    <अध्याय>अध्याय 5</अध्याय> <
    अध्याय>अध्याय 6</अध्याय> </अध्याय> </
 पुस्तक
>

एक्सएमएल स्कीमा

एक XML स्कीमा एक XML दस्तावेज़ की संरचना का विवरण है। संबंधित विनिर्देश (XML स्कीमा परिभाषा, या XSD) W3C अनुशंसा है।

XSD को उन नियमों को व्यक्त करने के लिए डिज़ाइन किया गया था जिनका एक XML दस्तावेज़ को पालन करना चाहिए। लेकिन हमारे लिए सबसे दिलचस्प बात यह है कि XSD को XML दस्तावेज़ों को संसाधित करने वाले सॉफ़्टवेयर को विकसित करते समय उपयोग करने के लिए डिज़ाइन किया गया था। यह हमें प्रोग्रामेटिक रूप से XML दस्तावेज़ की शुद्धता की जाँच करने देता है।

XML स्कीमा वाली फ़ाइलों में .xsd एक्सटेंशन होता है। एक्सएमएल स्कीमा डिजाइन करना इस पाठ के दायरे से बाहर है, इसलिए अभी के लिए बस इस बात से अवगत रहें कि संभावना मौजूद है।