உரை வடிவங்கள் ஏன் தேவை?

உரை வடிவங்கள் தகவல்களைச் சேமிப்பதற்கு வசதியானவை, ஏனெனில் அவை நிரல்களாலும் மனிதர்களாலும் உருவாக்கப்பட்டு செயலாக்கப்படலாம்.

உரை கோப்புகளை (உரை வடிவத்தில் உள்ள கோப்புகள்) பல்வேறு வகையான உரை எடிட்டர்களில் திறக்கலாம், படிக்கலாம் மற்றும் திருத்தலாம்.

பல நிரல்களில் எண்கள் மற்றும் பைனரி (ஆம்/இல்லை) மதிப்புகள் இருந்தாலும், உரை அடிப்படையிலான உள்ளமைவு கோப்புகளைப் பயன்படுத்துகின்றன.

உரையிலிருந்து உள் வடிவத்திற்கு மாற்ற வேண்டியதன் காரணமாக நிரல்களை இது மிகவும் சிக்கலாக்குகிறது, ஆனால் நிரலிலேயே உள்ளமைவு கருவியைப் பயன்படுத்தாமல் கைமுறையாக உள்ளமைவைத் திருத்துவதை இது சாத்தியமாக்குகிறது.

XML இப்போது எங்கே பயன்படுத்தப்படுகிறது?

எக்ஸ்எம்எல் ஐடியின் பல்வேறு பகுதிகளில் பயன்படுத்தப்படுகிறது. இது உள்ளமைவு கோப்புகள் (நிரல் அமைப்புகளுடன்) அல்லது நிரல்களுக்கு இடையில் தரவை மாற்றப் பயன்படும் கோப்புகளாக இருக்கலாம். ஜாவாவில், மிகவும் பொதுவான பயன்பாட்டு நிகழ்வுகளில் ஒன்று மேவன், ஒரு உருவாக்க ஆட்டோமேஷன் கருவியை உள்ளமைப்பது.

எக்ஸ்எம்எல் ஆவணத்தின் அமைப்பு

எக்ஸ்எம்எல் ஆவணத்தின் இயற்பியல் மற்றும் தருக்க கட்டமைப்புகள் தனித்தனியாக வைக்கப்படும். இயற்பியல் கட்டமைப்பின் அடிப்படையில், ஆவணம் மற்ற நிறுவனங்களைக் குறிக்கக்கூடிய நிறுவனங்களைக் கொண்டுள்ளது.

ஒரே மூல உறுப்பு ஆவண நிறுவனம் ஆகும். ஒரு நிறுவனம் என்பது ஒரு ஆவணத்தில் உள்ள சிறிய பகுதியாகும். அனைத்து நிறுவனங்களுக்கும் ஒரு பெயர் மற்றும் எழுத்துக்கள் உள்ளன.

இதையொட்டி, எழுத்துகள் இரண்டு வகைகளில் ஒன்றைச் சேர்ந்தவை: எழுத்துத் தரவு அல்லது மார்க்அப்.

மார்க்அப்பில் பின்வருவன அடங்கும்:

  • குறிச்சொற்கள், இது உறுப்பு எல்லைகளைக் குறிக்கிறது;
  • அறிவிப்புகள் மற்றும் செயலாக்க வழிமுறைகள், அவற்றின் பண்புக்கூறுகள் உட்பட;
  • நிறுவன குறிப்புகள்;
  • கருத்துக்கள்;
  • CDATA பிரிவுகளை மூடும் எழுத்து வரிசைகள்.

தர்க்கரீதியாக, ஆவணம் கூறுகள், கருத்துகள், அறிவிப்புகள், நிறுவன குறிப்புகள் மற்றும் செயலாக்க வழிமுறைகளைக் கொண்டுள்ளது. ஒரு ஆவணத்தில் இந்தக் கட்டமைப்பை உருவாக்க மார்க்அப் பயன்படுத்தப்படுகிறது.

ஒரு ஆவணத்தின் அனைத்து கூறுகளும் ஒரு முன்னுரை மற்றும் ஒரு மூல உறுப்பு என பிரிக்கப்படுகின்றன. ரூட் உறுப்பு ஒரு எக்ஸ்எம்எல் ஆவணத்தின் கட்டாய, இன்றியமையாத பகுதியாகும், அதே சமயம் ப்ரோலாக் இல்லாமல் இருக்கலாம். மூல உறுப்பு உள்ளமை உறுப்புகள், எழுத்துத் தரவு மற்றும் கருத்துகளைக் கொண்டிருக்கலாம். ஒரு ஆவணத்தின் உறுப்புகள் சரியாக உள்ளமைக்கப்பட வேண்டும்: மற்றொரு உறுப்புக்குள் தொடங்கும் எந்த உறுப்பும் அந்த உறுப்புக்குள் முடிவடைய வேண்டும்.

மார்க்அப் சின்னங்கள்

மார்க்அப் எப்போதும் < இல் தொடங்கி > உடன் முடிவடையும் .

< மற்றும் > (கோண அடைப்புக்குறிகள்) மற்றும் & (ஆம்பர்சண்ட் ) குறியீடுகள் ஒரு சிறப்புப் பாத்திரத்தை வகிக்கின்றன. கோண அடைப்புக்குறிகள் உறுப்புகளின் எல்லைகள், செயலாக்க வழிமுறைகள் மற்றும் வேறு சில வரிசைகளைக் குறிக்கின்றன. மேலும் உரையை உறுப்புகளுடன் மாற்றுவதற்கு ஆம்பர்சண்ட் உதவுகிறது.

எக்ஸ்எம்எல் அறிவிப்பு

XML அறிவிப்பு ஆவணத்தை எழுதப் பயன்படுத்தப்படும் மொழியின் பதிப்பைக் குறிப்பிடுகிறது. XML விவரக்குறிப்பு XML அறிவிப்புடன் ஒரு ஆவணத்தைத் தொடங்கச் சொல்கிறது, ஏனெனில் ஆவண உள்ளடக்கங்களின் சரியான விளக்கம் மொழியின் பதிப்பைப் பொறுத்தது.

மொழியின் முதல் பதிப்பில் (1.0), இந்த அறிவிப்பு விருப்பமானது, ஆனால் இது பிற்கால பதிப்புகளில் கட்டாயமாகும். விடுபட்ட அறிவிப்பு என்பது பதிப்பு 1.0 எனக் கருதப்படுகிறது. பிரகடனத்தில் ஆவண குறியாக்கம் பற்றிய தகவல்களும் இருக்கலாம்.

உதாரணமாக:

<?XML version="1.1" encoding="UTF-8" ?>

குறிச்சொற்கள்

குறிச்சொல் என்பது ஒரு தனிமத்தின் பெயரைக் கொண்ட மார்க்அப் கட்டமைப்பாகும். தொடக்க குறிச்சொற்கள் மற்றும் முடிவு குறிச்சொற்கள் உள்ளன. தொடக்க மற்றும் இறுதி கூறுகளை இணைக்கும் வெற்று உறுப்பு குறிச்சொற்களும் உள்ளன.

எடுத்துக்காட்டுகள்:

  • தொடக்கக் குறிச்சொல்: <tag1>

  • முடிவு குறிச்சொல்: </tag1>

  • வெற்று-உறுப்பு குறிச்சொல்: <empty_tag1 />

பண்புக்கூறுகள்

எக்ஸ்எம்எல் கூறுகளின் மற்றொரு பகுதி பண்புக்கூறுகள். ஒரு உறுப்பு பல தனித்துவமான பண்புகளைக் கொண்டிருக்கலாம். பண்புக்கூறுகள் ஒரு உறுப்பு பற்றிய கூடுதல் தகவலைக் குறிப்பிடலாம். அல்லது இன்னும் துல்லியமாக, பண்புக்கூறுகள் தனிமங்களின் பண்புகளை வரையறுக்கின்றன.

பண்புக்கூறு எப்போதும் பெயர்-மதிப்பு ஜோடி:

பெயர் = "மதிப்பு"

குறிச்சொல்லில் உள்ள பண்புக்கூறுக்கான எடுத்துக்காட்டு:

<tag1 name = "value">உறுப்பு</tag1>

ஒரு பண்புக்கூறின் மதிப்பு இரட்டை மேற்கோள்கள் ( " ) அல்லது ஒற்றை மேற்கோள்களில் ( ' ) மூடப்பட்டிருக்க வேண்டும். பண்புக்கூறுகள் தொடக்கக் குறிச்சொற்கள் மற்றும் வெற்று உறுப்பு குறிச்சொற்களில் மட்டுமே பயன்படுத்தப்படும்.

ஐந்து சிறப்பு எழுத்துகள் (<, >, ', ”, &)

வெளிப்படையாக, எழுத்துத் தரவு மற்றும் பண்புக்கூறு மதிப்புகளில் < , > மற்றும் & குறியீடுகளைப் பயன்படுத்த முடியாது. அவற்றைப் பிரதிநிதித்துவப்படுத்த நீங்கள் சிறப்புத் தப்பிக்கும் வரிசைகளை உருவாக்க வேண்டும். பண்புக்கூறு மதிப்புகளுக்குள் அப்போஸ்ட்ரோபிகள் மற்றும் மேற்கோள் குறிகளை எழுதும் போது சிறப்பு வரிசைகளும் பயன்படுத்தப்படுகின்றன:

சின்னம் மாற்று
< <
> >
& &
' '
" "

மேலும், \\ எழுத்தை எழுத , \\ பயன்படுத்த வேண்டும் .

CDATA பிரிவு

CDATA பிரிவு என்பது உரையின் தருக்க அலகு அல்ல. XML தொடரியல் ஆவணத்தில் எழுத்துத் தரவை வைக்க அனுமதிக்கும் இடத்தில் இந்த வகையான பிரிவு ஏற்படலாம்.

பிரிவு <![CDATA[ எனத் தொடங்கி ]]> உடன் முடிகிறது . இந்த மார்க்அப் பிட்களுக்கு இடையே எழுத்துத் தரவு வைக்கப்படுகிறது, மேலும் < , > , & & குறியீடுகள் அவற்றின் நேரடி வடிவத்தில் பயன்படுத்தப்படலாம்.

கருத்துகள்

கருத்துகள் எழுத்துத் தரவுகளாகக் கருதப்படுவதில்லை. ஒரு கருத்து <!-- என்று தொடங்கி --> என்று முடிவடைகிறது . எழுத்து வரிசை -- கருத்துக்குள் பயன்படுத்த முடியாது. மேலும், ஒரு கருத்தின் உள்ளே, ஆம்பர்சண்ட் எழுத்து மார்க்அப்பைக் குறிக்கவில்லை.

உதாரணமாக:

<!-- இது ஒரு கருத்து -->

பெயர்கள்

எக்ஸ்எம்எல்லில், எல்லாப் பெயர்களிலும் யூனிகோட் எழுத்து அட்டவணை, அரபு எண்கள், காலங்கள், பெருங்குடல்கள், ஹைபன்கள் மற்றும் அடிக்கோடிட்டுகளில் எழுத்துக்கள் மட்டுமே இருக்க முடியும். பெயர்கள் ஒரு எழுத்து, பெருங்குடல் அல்லது அடிக்கோடிட்டு ஆரம்பிக்கலாம். XML என்ற சரத்துடன் பெயர் தொடங்க முடியாது என்பதை நினைவில் கொள்ளவும் .

உதாரணமாக

ஜாவா வகுப்பையும் அந்த வகுப்பின் ஒரு பொருளையும் பார்ப்போம். பின்னர் பொருளை எக்ஸ்எம்எல் வடிவத்தில் வரிசைப்படுத்த முயற்சிப்போம். வகுப்பு குறியீடு:


public class Book {
   private String title;
   private String author;
   private Integer pageCount;
   private List<String> chapters;

   public Book(String title, String author, Integer pageCount, List<String> chapters) {
       this.title = title;
       this.author = author;
       this.pageCount = pageCount;
       this.chapters = chapters;
   }
// Getters/setters
}

மற்றும் பொருட்களை உருவாக்குதல்:


Book book = new Book("My Favorite Book", "Amigo", 999, Arrays.asList("Chapter 1", "Chapter 2", "Chapter 3", "Chapter 4", "Chapter 5", "Chapter 6"));

4 புலங்களைக் கொண்ட ஜாவா பொருளின் சரியான எக்ஸ்எம்எல் பிரதிநிதித்துவத்திற்கான எடுத்துக்காட்டு இங்கே உள்ளது, அவற்றில் ஒன்று சேகரிப்பு (மேலே உள்ள ஜாவா குறியீட்டைப் பார்க்கவும்):

<புத்தகம்>
  <title>எனக்கு பிடித்த புத்தகம்</title>
  <author>Amigo</author>
  <pageCount>999</pageCount>
 <chapters>
    <chapters>அத்தியாயம் 1</ chapters>
    < chapters> அத்தியாயம் 2</ chapters>
    < chapters >அத்தியாயம் 3</ chapters >
    < chapters >அத்தியாயம் 4</ chapters >
    < chapters >அத்தியாயம் 5</ chapters >
    < chapters >அத்தியாயம் 6</ chapters > </ chapters >
 <
/Book >

எக்ஸ்எம்எல் ஸ்கீமா

எக்ஸ்எம்எல் ஸ்கீமா என்பது எக்ஸ்எம்எல் ஆவணத்தின் கட்டமைப்பின் விளக்கமாகும். தொடர்புடைய விவரக்குறிப்பு (எக்ஸ்எம்எல் ஸ்கீமா டெபினிஷன் அல்லது எக்ஸ்எஸ்டி) ஒரு W3C பரிந்துரையாகும்.

எக்ஸ்எம்எல் ஆவணம் பின்பற்ற வேண்டிய விதிகளை வெளிப்படுத்த XSD வடிவமைக்கப்பட்டது. ஆனால் எங்களுக்கு மிகவும் சுவாரஸ்யமான விஷயம் என்னவென்றால், எக்ஸ்எம்எல் ஆவணங்களை செயலாக்கும் மென்பொருளை உருவாக்கும் போது XSD பயன்படுத்த வடிவமைக்கப்பட்டுள்ளது. இது ஒரு எக்ஸ்எம்எல் ஆவணத்தின் சரியான தன்மையை நிரல் ரீதியாக சரிபார்க்க உதவுகிறது.

எக்ஸ்எம்எல் ஸ்கீமாவைக் கொண்ட கோப்புகள் .xsd நீட்டிப்பைக் கொண்டுள்ளன. எக்ஸ்எம்எல் ஸ்கீமாவை வடிவமைப்பது இந்தப் பாடத்தின் எல்லைக்கு அப்பாற்பட்டது, எனவே இப்போதைக்கு சாத்தியம் இருப்பதைக் கவனியுங்கள்.