मजकूर स्वरूपांची आवश्यकता का आहे?

माहिती संचयित करण्यासाठी मजकूर स्वरूप सोयीस्कर आहे कारण ते प्रोग्राम आणि मानव दोघांद्वारे तयार आणि प्रक्रिया केले जाऊ शकतात.

मजकूर फाइल्स (टेक्स्ट फॉरमॅटमधील फाइल्स) विविध प्रकारच्या टेक्स्ट एडिटरमध्ये उघडल्या, वाचल्या आणि संपादित केल्या जाऊ शकतात.

अनेक प्रोग्राम मजकूर-आधारित कॉन्फिगरेशन फाइल्स वापरतात, जरी फॉरमॅटमध्ये संख्या आणि बायनरी (होय/नाही) मूल्ये असतील.

हे मजकूरातून अंतर्गत स्वरूपनात रूपांतरित करण्याच्या गरजेमुळे प्रोग्राम काहीसे अधिक क्लिष्ट बनवते आणि त्याउलट, परंतु प्रोग्राममध्येच कॉन्फिगरेशन साधन न वापरता कॉन्फिगरेशन व्यक्तिचलितपणे संपादित करणे शक्य करते.

XML आता कुठे वापरले जाते?

XML IT च्या विविध क्षेत्रांमध्ये वापरला जातो. हे कॉन्फिगरेशन फायली (प्रोग्राम सेटिंग्जसह) किंवा प्रोग्राम दरम्यान डेटा हस्तांतरित करण्यासाठी वापरल्या जाणार्‍या फायली असू शकतात. Java मध्ये, सर्वात सामान्य वापराच्या प्रकरणांपैकी एक म्हणजे Maven कॉन्फिगर करणे, एक बिल्ड ऑटोमेशन टूल.

XML दस्तऐवजाची रचना

XML दस्तऐवजाची भौतिक आणि तार्किक रचना वेगळी ठेवली जाते. भौतिक संरचनेच्या दृष्टीने, दस्तऐवजात अशा घटकांचा समावेश असतो ज्या इतर घटकांचा संदर्भ घेऊ शकतात.

एकमेव मूळ घटक दस्तऐवज अस्तित्व आहे. एखादी संस्था दस्तऐवजातील सर्वात लहान भाग आहे. सर्व घटकांना नाव असते आणि त्यात वर्ण असतात.

यामधून, वर्ण दोन श्रेणींपैकी एकाशी संबंधित आहेत: वर्ण डेटा किंवा मार्कअप.

मार्कअपमध्ये हे समाविष्ट आहे:

  • टॅग, जे घटक सीमा दर्शवतात;
  • घोषणा आणि प्रक्रिया सूचना, त्यांच्या गुणधर्मांसह;
  • अस्तित्व संदर्भ;
  • टिप्पण्या;
  • CDATA विभाग रॅपिंग वर्ण क्रम.

तार्किकदृष्ट्या, दस्तऐवजात घटक, टिप्पण्या, घोषणा, अस्तित्व संदर्भ आणि प्रक्रिया सूचना असतात. ही सर्व रचना डॉक्युमेंटमध्ये तयार करण्यासाठी मार्कअपचा वापर केला जातो.

दस्तऐवजाचे सर्व घटक भाग प्रोलॉग आणि रूट घटकामध्ये विभागलेले आहेत. मूळ घटक XML दस्तऐवजाचा अनिवार्य, अत्यावश्यक भाग आहे, तर प्रोलॉग कदाचित अस्तित्वात नाही. रूट घटकामध्ये नेस्टेड घटक, वर्ण डेटा आणि टिप्पण्या असू शकतात. दस्तऐवजाचे घटक योग्यरित्या नेस्ट केलेले असणे आवश्यक आहे: दुसर्‍या घटकामध्ये सुरू होणारा कोणताही घटक त्या घटकामध्ये देखील समाप्त झाला पाहिजे.

मार्कअप चिन्हे

मार्कअप नेहमी < ने सुरू होतो आणि > ने समाप्त होतो .

< आणि > (कोन कंस) आणि & (अँपरसँड) चिन्हे विशेष भूमिका बजावतात. कोन कंस घटकांच्या सीमा, प्रक्रिया सूचना आणि काही इतर क्रम दर्शवितात. आणि अँपरसँड आम्हाला मजकूर घटकांसह बदलण्यास मदत करते.

XML घोषणा

XML घोषणा दस्तऐवज लिहिण्यासाठी वापरल्या जाणार्‍या भाषेची आवृत्ती निर्दिष्ट करते. XML स्पेसिफिकेशन XML घोषणेसह दस्तऐवज सुरू करण्यास सांगते कारण दस्तऐवजातील सामग्रीचे योग्य व्याख्या भाषेच्या आवृत्तीवर अवलंबून असते.

भाषेच्या पहिल्या आवृत्तीत (1.0), ही घोषणा ऐच्छिक होती, परंतु नंतरच्या आवृत्त्यांमध्ये ती अनिवार्य आहे. गहाळ घोषणा म्हणजे आवृत्ती 1.0 असे गृहीत धरले जाते. घोषणेमध्ये दस्तऐवज एन्कोडिंगबद्दल माहिती देखील असू शकते.

उदाहरण:

<?XML version="1.1" encoding="UTF-8" ?>

टॅग्ज

टॅग एक मार्कअप रचना आहे ज्यामध्ये घटकाचे नाव असते. स्टार्ट टॅग आणि एंड टॅग आहेत. रिक्त-घटक टॅग देखील आहेत जे प्रारंभ आणि समाप्ती घटक एकत्र करतात.

उदाहरणे:

  • प्रारंभ टॅग: <tag1>

  • टॅग समाप्त करा: </tag1>

  • रिक्त-घटक टॅग: <empty_tag1 />

विशेषता

XML घटकांचा आणखी एक भाग म्हणजे विशेषता. एका घटकामध्ये अनेक अद्वितीय गुणधर्म असू शकतात. विशेषता आम्हाला घटकाबद्दल अधिक माहिती निर्दिष्ट करू देते. किंवा अधिक अचूकपणे, विशेषता घटकांचे गुणधर्म परिभाषित करतात.

विशेषता नेहमी नाव-मूल्याची जोडी असते:

नाव = "मूल्य"

टॅगमधील विशेषताचे उदाहरण:

<tag1 name = "value">घटक</tag1>

विशेषताचे मूल्य दुहेरी अवतरण ( " ) किंवा सिंगल कोट्स ( ' ) मध्ये गुंडाळलेले असणे आवश्यक आहे. विशेषता फक्त प्रारंभ टॅग आणि रिक्त-घटक टॅगमध्ये वापरली जातात.

पाच विशेष वर्ण (<, >, ', ”, &)

स्पष्टपणे, < , > आणि & चिन्हे वर्ण डेटा आणि विशेषता मूल्यांमध्ये वापरली जाऊ शकत नाहीत. त्यांचे प्रतिनिधित्व करण्यासाठी तुम्हाला विशेष एस्केप अनुक्रमांची आवश्यकता आहे. विशेषता मूल्यांमध्ये अॅपोस्ट्रॉफी आणि अवतरण चिन्हे लिहिताना विशेष क्रम देखील वापरले जातात:

चिन्ह बदली
< <
> >
आणि &
' '
" "

तसेच, \ वर्ण लिहिण्यासाठी , तुम्हाला \\ वापरणे आवश्यक आहे .

CDATA विभाग

CDATA विभाग मजकूराचे तार्किक एकक नाही. या प्रकारचा विभाग येऊ शकतो जेथे XML वाक्यरचना आपल्याला दस्तऐवजात वर्ण डेटा ठेवू देते.

विभाग <![CDATA[ ने सुरू होतो आणि ]]> ने समाप्त होतो . मार्कअपच्या या बिट्समध्ये वर्ण डेटा ठेवला जातो आणि < , > , आणि & चिन्हे त्यांच्या थेट स्वरूपात वापरली जाऊ शकतात.

टिप्पण्या

टिप्पण्या वर्ण डेटा मानल्या जात नाहीत. टिप्पणी <!-- ने सुरू होते आणि --> ने समाप्त होते . वर्ण क्रम -- टिप्पणीमध्ये वापरला जाऊ शकत नाही. तसेच, टिप्पणीच्या आत, अँपरसँड वर्ण मार्कअप दर्शवत नाही.

उदाहरण:

<!-- ही एक टिप्पणी आहे -->

नावे

XML मध्ये, सर्व नावांमध्ये फक्त युनिकोड वर्ण सारणी, अरबी अंक, पूर्णविराम, कोलन, हायफन आणि अंडरस्कोअरमधील अक्षरे असू शकतात. नावे अक्षर, कोलन किंवा अंडरस्कोरने सुरू होऊ शकतात. लक्षात घ्या की नाव XML स्ट्रिंगने सुरू होऊ शकत नाही .

उदाहरण

चला जावा क्लास आणि त्या क्लासचे ऑब्जेक्ट पाहू. मग आपण ऑब्जेक्टला XML फॉरमॅटमध्ये क्रमबद्ध करण्याचा प्रयत्न करू. वर्ग कोड:


public class Book {
   private String title;
   private String author;
   private Integer pageCount;
   private List<String> chapters;

   public Book(String title, String author, Integer pageCount, List<String> chapters) {
       this.title = title;
       this.author = author;
       this.pageCount = pageCount;
       this.chapters = chapters;
   }
// Getters/setters
}

आणि वस्तूंची निर्मिती:


Book book = new Book("My Favorite Book", "Amigo", 999, Arrays.asList("Chapter 1", "Chapter 2", "Chapter 3", "Chapter 4", "Chapter 5", "Chapter 6"));

येथे जावा ऑब्जेक्टच्या वैध XML प्रतिनिधित्वाचे उदाहरण आहे ज्यामध्ये 4 फील्ड आहेत, त्यापैकी एक संग्रह आहे (वरील Java कोड पहा):

<पुस्तक>
  <title>माझे आवडते पुस्तक</title>
  <author>Amigo</author>
  <pageCount>999</pageCount>
 <chapters>
    <chapters>धडा 1</chapters>
    <chapters>धडा 2</chapters>
    <अध्याय>धडा 3</अध्याय>
    <अध्याय>धडा 4</अध्याय>
    <अध्याय>धडा 5</chapters>
    <अध्याय>धडा 6</chapters>
 </chapters>
</पुस्तक>

XML स्कीमा

XML स्कीमा म्हणजे XML दस्तऐवजाच्या संरचनेचे वर्णन. संबंधित तपशील (XML स्कीमा व्याख्या, किंवा XSD) ही W3C शिफारस आहे.

XSD ची रचना XML दस्तऐवजाने पाळली पाहिजे असे नियम व्यक्त करण्यासाठी केली होती. परंतु आमच्यासाठी सर्वात मनोरंजक गोष्ट अशी आहे की XSD हे XML दस्तऐवजांवर प्रक्रिया करणारे सॉफ्टवेअर विकसित करताना वापरण्यासाठी डिझाइन केले होते. हे आम्हाला XML दस्तऐवजाची प्रोग्रामॅटिकली अचूकता तपासू देते.

XML स्कीमा असलेल्या फाइल्समध्ये .xsd विस्तार असतो. XML स्कीमा डिझाईन करणे या धड्याच्या व्याप्तीच्या पलीकडे आहे, म्हणून आत्ता फक्त याची जाणीव ठेवा की शक्यता अस्तित्वात आहे.