CodeGym /Java Blog /சீரற்ற /ஜாவாவில் வழக்கமான வெளிப்பாடுகள்

நிலை 41

San Francisco

21 ஜூலை 2023
180 views
0 comments

ஜாவாவில் வழக்கமான வெளிப்பாடுகள்

வழக்கமான வெளிப்பாடுகள் என்பது புரோகிராமர்கள், அனுபவம் வாய்ந்தவர்கள் கூட, பெரும்பாலும் பின்னர் ஒத்திவைக்கும் ஒரு தலைப்பு. ஆனால் விரைவில் அல்லது பின்னர், பெரும்பாலான ஜாவா டெவலப்பர்கள் உரை தகவல்களை செயலாக்க வேண்டும். பெரும்பாலும், இது உரையைத் தேடுதல் மற்றும் திருத்துதல் என்பதாகும். வழக்கமான வெளிப்பாடுகள் இல்லாமல், பயனுள்ள மற்றும் சுருக்கமான உரை-செயலாக்க குறியீடு வெறுமனே நினைத்துப் பார்க்க முடியாதது. எனவே தள்ளிப்போடுவதை நிறுத்துங்கள், வழக்கமான வெளிப்பாடுகளை இப்போதே சமாளிப்போம். இது அவ்வளவு கடினம் அல்ல. ஜாவாவில் வழக்கமான வெளிப்பாடுகள் - 1

வழக்கமான வெளிப்பாடு (regex) என்றால் என்ன?

உண்மையில், ஒரு வழக்கமான வெளிப்பாடு என்பது உரையில் ஒரு சரத்தைக் கண்டறிவதற்கான ஒரு வடிவமாகும். ஜாவாவில், இந்த வடிவத்தின் அசல் பிரதிநிதித்துவம் எப்போதும் ஒரு சரம், அதாவது வகுப்பின் பொருள் String. இருப்பினும், இது வழக்கமான வெளிப்பாடாக தொகுக்கக்கூடிய எந்த சரமும் அல்ல - வழக்கமான வெளிப்பாடுகளை உருவாக்குவதற்கான விதிகளுக்கு இணங்கக்கூடிய சரங்கள் மட்டுமே. தொடரியல் மொழி விவரக்குறிப்பில் வரையறுக்கப்பட்டுள்ளது. வழக்கமான வெளிப்பாடுகள் எழுத்துகள் மற்றும் எண்களைப் பயன்படுத்தி எழுதப்படுகின்றன, அதே போல் மெட்டாக்ராக்டர்கள், அவை வழக்கமான வெளிப்பாடு தொடரியல் சிறப்புப் பொருளைக் கொண்ட எழுத்துக்களாகும். உதாரணத்திற்கு:


String regex = "java"; // The pattern is "java";
String regex = "\\d{3}"; // The pattern is three digits;

ஜாவாவில் வழக்கமான வெளிப்பாடுகளை உருவாக்குதல்

ஜாவாவில் வழக்கமான வெளிப்பாட்டை உருவாக்குவது இரண்டு எளிய படிகளை உள்ளடக்கியது:

வழக்கமான வெளிப்பாடு தொடரியல் இணங்கும் ஒரு சரமாக எழுதவும்;
சரத்தை வழக்கமான வெளிப்பாடாக தொகுக்கவும்;

Patternஎந்த ஜாவா நிரலிலும், ஒரு பொருளை உருவாக்குவதன் மூலம் வழக்கமான வெளிப்பாடுகளுடன் வேலை செய்யத் தொடங்குகிறோம் . இதைச் செய்ய, வகுப்பின் இரண்டு நிலையான முறைகளில் ஒன்றை நாம் அழைக்க வேண்டும்: compile. முதல் முறை ஒரு வாதத்தை எடுக்கும் - வழக்கமான வெளிப்பாட்டைக் கொண்ட ஒரு சரம், இரண்டாவது முறை-பொருந்தும் அமைப்புகளைத் தீர்மானிக்கும் கூடுதல் வாதத்தை எடுக்கும்:


public static Pattern compile (String literal)
public static Pattern compile (String literal, int flags)

அளவுருவின் சாத்தியமான மதிப்புகளின் பட்டியல் வகுப்பில் flagsவரையறுக்கப்பட்டுள்ளது Patternமற்றும் நிலையான வகுப்பு மாறிகளாக நமக்குக் கிடைக்கிறது. உதாரணத்திற்கு:


Pattern pattern = Pattern.compile("java", Pattern.CASE_INSENSITIVE); // Pattern-matching will be case insensitive.

அடிப்படையில், Patternவகுப்பு என்பது வழக்கமான வெளிப்பாடுகளுக்கான கட்டமைப்பாகும். ஹூட்டின் கீழ், தொகுக்கப்பட்ட பிரதிநிதித்துவத்தை உருவாக்க இந்த compileமுறை வகுப்பின் தனிப்பட்ட கட்டமைப்பாளரை அழைக்கிறது . Patternஇந்த பொருள்-உருவாக்கம் பொறிமுறையானது மாறாத பொருட்களை உருவாக்குவதற்காக இந்த வழியில் செயல்படுத்தப்படுகிறது. வழக்கமான வெளிப்பாடு உருவாக்கப்படும் போது, அதன் தொடரியல் சரிபார்க்கப்படும். சரத்தில் பிழைகள் இருந்தால், a PatternSyntaxExceptionஉருவாக்கப்படும்.

வழக்கமான வெளிப்பாடு தொடரியல்

வழக்கமான வெளிப்பாடு தொடரியல் எழுத்துக்களை சார்ந்துள்ளது <([{\^-=$!|]})?*+.>, அவை எழுத்துக்களுடன் இணைக்கப்படலாம். அவற்றின் பங்கைப் பொறுத்து, அவை பல குழுக்களாகப் பிரிக்கப்படுகின்றன: 1. கோடுகள் அல்லது உரையின் எல்லைகளை பொருத்துவதற்கான மெட்டாக்ராக்டர்கள்

மெட்டா கேரக்டர்	விளக்கம்
^	ஒரு வரியின் ஆரம்பம்
$	ஒரு வரியின் முடிவு
\b	வார்த்தை எல்லை
\B	வார்த்தை அல்லாத எல்லை
\A	உள்ளீட்டின் ஆரம்பம்
\G	முந்தைய போட்டியின் முடிவு
\Z	உள்ளீட்டின் முடிவு
\z	உள்ளீட்டின் முடிவு

2. முன் வரையறுக்கப்பட்ட எழுத்து வகுப்புகளைப் பொருத்துவதற்கான மெட்டாக்ராக்டர்கள்

மெட்டா கேரக்டர்	விளக்கம்
\d	இலக்கம்
\D	இலக்கமற்ற
\s	வெண்வெளி எழுத்து
\S	வெள்ளைவெளி அல்லாத எழுத்து
\w	எண்ணெழுத்து எழுத்து அல்லது அடிக்கோடு
\W	எழுத்துக்கள், எண்கள் மற்றும் அடிக்கோடினைத் தவிர எந்த எழுத்தும்
.	எந்த பாத்திரம்

3. கட்டுப்பாட்டு எழுத்துகளைப் பொருத்துவதற்கான மெட்டாக்ராக்டர்கள்

மெட்டா கேரக்டர்	விளக்கம்
\t	தாவல் எழுத்து
\n	புதிய வரி எழுத்து
\r	வண்டி திரும்புதல்
\f	வரிவடிவம் பாத்திரம்
\u0085	அடுத்த வரி பாத்திரம்
\u2028	வரி பிரிப்பான்
\u2029	பத்தி பிரிப்பான்

4. எழுத்து வகுப்புகளுக்கான மெட்டாக்ராக்டர்கள்

மெட்டா கேரக்டர்	விளக்கம்
[abc]	பட்டியலிடப்பட்ட எழுத்துக்களில் ஏதேனும் (a, b, அல்லது c)
[^abc]	பட்டியலிடப்பட்டவை தவிர வேறு எந்த எழுத்தும் (a, b அல்லது c அல்ல)
[a-zA-Z]	இணைக்கப்பட்ட வரம்புகள் (a முதல் z வரையிலான லத்தீன் எழுத்துக்கள், கேஸ் சென்சிட்டிவ்)
[ad[mp]]	எழுத்துகளின் ஒன்றியம் (a முதல் d வரை மற்றும் m முதல் p வரை)
[az&&[def]]	எழுத்துக்களின் குறுக்குவெட்டு (d, e, f)
[az&&[^bc]]	எழுத்துக்களின் கழித்தல் (a, dz)

5. எழுத்துக்களின் எண்ணிக்கையைக் குறிக்கும் மெட்டாஎராக்டர்கள் (அளவிப்பான்கள்). ஒரு குவாண்டிஃபையர் எப்போதும் ஒரு எழுத்து அல்லது எழுத்துக் குழுவால் முன்வைக்கப்படுகிறது.

மெட்டா கேரக்டர்	விளக்கம்
?	ஒன்று அல்லது இல்லை
*	பூஜ்யம் அல்லது அதற்கு மேற்பட்ட முறை
+	ஒன்று அல்லது அதற்கு மேற்பட்ட முறை
{n}	n முறை
{n,}	n அல்லது அதற்கு மேற்பட்ட முறை
{n,m}	குறைந்தபட்சம் n முறை மற்றும் m முறைக்கு மேல் இல்லை

பேராசை கொண்ட அளவுகோல்கள்

அளவுகோல்களைப் பற்றி நீங்கள் தெரிந்து கொள்ள வேண்டிய ஒன்று, அவை மூன்று வெவ்வேறு வகைகளில் வருகின்றன: பேராசை, உடைமை மற்றும் தயக்கம். +குவாண்டிஃபையருக்குப் பிறகு ஒரு " " எழுத்தைச் சேர்ப்பதன் மூலம் நீங்கள் ஒரு குவாண்டிஃபையரை உடைமையாக்குகிறீர்கள் . " "ஐச் சேர்ப்பதன் மூலம் அதை தயக்கமடையச் செய்கிறீர்கள் ?. உதாரணத்திற்கு:


"A.+a" // greedy
"A.++a" // possessive
"A.+?a" // reluctant

பல்வேறு வகையான அளவீடுகள் எவ்வாறு செயல்படுகின்றன என்பதைப் புரிந்துகொள்ள இந்த வடிவத்தைப் பயன்படுத்த முயற்சிப்போம். இயல்பாக, அளவீடுகள் பேராசை கொண்டவை. இதன் பொருள் அவர்கள் சரத்தில் மிக நீளமான பொருத்தத்தைத் தேடுகிறார்கள். பின்வரும் குறியீட்டை இயக்கினால்:


public static void main(String[] args) {
    String text = "Fred Anna Alexander";
    Pattern pattern = Pattern.compile("A.+a");
    Matcher matcher = pattern.matcher(text);
    while (matcher.find()) {
        System.out.println(text.substring(matcher.start(), matcher.end()));
    }
}

இந்த வெளியீட்டைப் பெறுகிறோம்:


Anna Alexa

வழக்கமான வெளிப்பாடு " A.+a"க்கு, முறை-பொருத்தம் பின்வருமாறு செய்யப்படுகிறது:

குறிப்பிடப்பட்ட வடிவத்தில் முதல் எழுத்து லத்தீன் எழுத்து A. Matcherகுறியீட்டு பூஜ்ஜியத்திலிருந்து தொடங்கி, உரையின் ஒவ்வொரு எழுத்துடனும் ஒப்பிடுகிறது. எழுத்து Fஎங்கள் உரையில் குறியீட்டு பூஜ்ஜியத்தில் உள்ளது, எனவே Matcherஅது வடிவத்துடன் பொருந்தும் வரை எழுத்துகள் மூலம் மீண்டும் மீண்டும் வருகிறது. எங்கள் எடுத்துக்காட்டில், இந்த எழுத்து குறியீட்டு 5 இல் காணப்படுகிறது.
வடிவத்தின் முதல் எழுத்துடன் பொருத்தம் கண்டறியப்பட்டதும், Matcherஅதன் இரண்டாவது எழுத்துடன் பொருத்தத்தைத் தேடுகிறது. எங்கள் விஷயத்தில், இது " ."எழுத்து, எந்த ஒரு பாத்திரத்தையும் குறிக்கிறது.

பாத்திரம் nஆறாவது இடத்தில் உள்ளது. இது நிச்சயமாக "எந்தவொரு பாத்திரத்திற்கும்" பொருத்தமாக இருக்கும்.
Matcherவடிவத்தின் அடுத்த எழுத்தை சரிபார்க்க தொடர்கிறது. எங்கள் வடிவத்தில், இது முந்தைய எழுத்துக்கு பொருந்தும் அளவுகோலில் சேர்க்கப்பட்டுள்ளது: " .+". நமது பேட்டர்னில் "எந்த எழுத்தும்" மீண்டும் மீண்டும் வருவதின் எண்ணிக்கை ஒன்று அல்லது அதற்கு மேற்பட்ட முறை என்பதால், Matcherசரத்திலிருந்து அடுத்த எழுத்தை மீண்டும் மீண்டும் எடுத்து, அது "எந்த எழுத்துடன்" பொருந்துகிறதோ, அந்த வடிவத்திற்கு எதிராக அதைச் சரிபார்க்கவும். எங்கள் எடுத்துக்காட்டில் - சரத்தின் இறுதி வரை (இன்டெக்ஸ் 7 முதல் இன்டெக்ஸ் 18 வரை).

அடிப்படையில், Matcherசரத்தை இறுதிவரை கொப்பளிக்கிறது - இது துல்லியமாக "பேராசை" என்பதன் பொருள்.
மேட்சர் உரையின் முடிவை அடைந்து, பேட்டர்னின் "" பகுதியைச் சரிபார்த்த பிறகு A.+, அது மீதமுள்ள பேட்டர்னைச் சரிபார்க்கத் தொடங்குகிறது: a. முன்னோக்கி எந்த உரையும் இல்லை, எனவே காசோலை கடைசி எழுத்தில் இருந்து "பேக் ஆஃப்" மூலம் தொடர்கிறது:
Matcher.+வடிவத்தின் " " பகுதியில் மீண்டும் மீண்டும் எண்ணிக்கையை "நினைவில் கொள்கிறது" . இந்த கட்டத்தில், இது மீண்டும் மீண்டும் செய்யும் எண்ணிக்கையை ஒன்று குறைக்கிறது மற்றும் ஒரு பொருத்தம் கண்டறியப்படும் வரை உரைக்கு எதிராக பெரிய வடிவத்தை சரிபார்க்கிறது:

உடைமை அளவுகோல்கள்

உடைமை அளவுகோல்கள் பேராசை கொண்டவை போன்றவை. வித்தியாசம் என்னவென்றால், சரத்தின் இறுதிவரை உரை எடுக்கப்பட்டால், "பேக் ஆஃப்" செய்யும் போது பேட்டர்ன்-மேட்ச் இல்லை. வேறு வார்த்தைகளில் கூறுவதானால், முதல் மூன்று நிலைகளும் பேராசை கொண்ட அளவுகோல்களைப் போலவே இருக்கும். முழு சரத்தையும் கைப்பற்றிய பிறகு, மேட்ச் செய்பவர் அது கருத்தில் கொண்டவற்றுடன் மீதமுள்ள வடிவத்தைச் சேர்த்து, கைப்பற்றப்பட்ட சரத்துடன் ஒப்பிடுகிறார். எங்கள் எடுத்துக்காட்டில், " A.++a" வழக்கமான வெளிப்பாட்டைப் பயன்படுத்தி, முக்கிய முறை எந்தப் பொருத்தத்தையும் காணவில்லை. ஜாவாவில் வழக்கமான வெளிப்பாடுகள் - 7

தயக்கம் காட்டுபவர்கள்

இந்த அளவுகோல்களுக்கு, பேராசை கொண்ட வகையைப் போலவே, குறியீடு வடிவத்தின் முதல் எழுத்தின் அடிப்படையில் ஒரு பொருத்தத்தைத் தேடுகிறது:
பின்னர் அது மாதிரியின் அடுத்த எழுத்துடன் (எந்த எழுத்தும்) பொருத்தத்தைத் தேடுகிறது:
பேராசை கொண்ட மாதிரி-பொருத்தம் போலல்லாமல், தயக்கத்துடன் மாதிரி-பொருத்தத்தில் குறுகிய பொருத்தம் தேடப்படுகிறது. இதன் பொருள், பேட்டர்னின் இரண்டாவது எழுத்துடன் (உரையில் 6வது இடத்தில் உள்ள எழுத்துக்கு ஒத்திருக்கும் ஒரு காலகட்டம், Matcherஉரையானது மீதமுள்ள வடிவத்துடன் பொருந்துகிறதா என்பதைச் சரிபார்க்கிறது - " a"
உரையானது வடிவத்துடன் பொருந்தவில்லை (அதாவது இது nகுறியீட்டு 7 இல் " " என்ற எழுத்தைக் கொண்டுள்ளது), எனவே Matcherமேலும் ஒன்று "எந்த எழுத்துகளையும்" சேர்க்கிறது, ஏனெனில் அளவுகோல் ஒன்று அல்லது அதற்கு மேற்பட்டதைக் குறிக்கிறது. பின்னர் அது மீண்டும் வடிவத்தை 5 முதல் 8 நிலைகளில் உள்ள உரையுடன் ஒப்பிடுகிறது:

எங்கள் விஷயத்தில், ஒரு பொருத்தம் கண்டறியப்பட்டது, ஆனால் நாங்கள் இன்னும் உரையின் முடிவை அடையவில்லை. எனவே, பேட்டர்ன்-பொருத்தம் நிலை 9 இலிருந்து மறுதொடக்கம் செய்யப்படுகிறது, அதாவது மாதிரியின் முதல் எழுத்து ஒரே மாதிரியான அல்காரிதத்தைப் பயன்படுத்துவதைத் தேடுகிறது, மேலும் இது உரையின் இறுதி வரை மீண்டும் நிகழும்.

அதன்படி, main"" வடிவத்தைப் பயன்படுத்தும் போது இந்த முறை பின்வரும் முடிவைப் பெறுகிறது A.+?a: அண்ணா அலெக்சா எங்கள் எடுத்துக்காட்டில் இருந்து நீங்கள் பார்க்க முடியும், வெவ்வேறு வகையான அளவீடுகள் ஒரே மாதிரிக்கு வெவ்வேறு முடிவுகளைத் தருகின்றன. எனவே இதை மனதில் வைத்து, நீங்கள் தேடுவதைப் பொறுத்து சரியான வகையைத் தேர்ந்தெடுக்கவும்.

வழக்கமான வெளிப்பாடுகளில் எஸ்கேப்பிங் கேரக்டர்கள்

ஜாவாவில் ஒரு வழக்கமான வெளிப்பாடு, அல்லது அதற்கு மாறாக, அதன் அசல் பிரதிநிதித்துவம், ஒரு சரம் இலக்கியமாக இருப்பதால், சரம் எழுத்துகள் தொடர்பான ஜாவா விதிகளை நாம் கணக்கிட வேண்டும். குறிப்பாக, \ஜாவா மூலக் குறியீட்டில் உள்ள ஸ்ட்ரிங் லிட்டரலில் உள்ள பின்சாய்வு எழுத்து "" ஒரு கட்டுப்பாட்டு எழுத்து என விளக்கப்படுகிறது, இது அடுத்த எழுத்து சிறப்பு மற்றும் ஒரு சிறப்பு வழியில் விளக்கப்பட வேண்டும் என்று கம்பைலருக்குக் கூறுகிறது. உதாரணத்திற்கு:


String s = "The root directory is \nWindows"; // Move "Windows" to a new line
String s = "The root directory is \u00A7Windows"; // Insert a paragraph symbol before "Windows"

இதன் பொருள், வழக்கமான வெளிப்பாடுகளை விவரிக்கும் மற்றும் " \" எழுத்துக்களை (அதாவது மெட்டாக்ராக்டர்களைக் குறிக்க) பயன்படுத்தும் சரம் எழுத்துகள், ஜாவா பைட்கோட் கம்பைலர் சரத்தை தவறாகப் புரிந்து கொள்ளாமல் இருப்பதை உறுதிசெய்ய பின்சாய்வுகளை மீண்டும் செய்ய வேண்டும். உதாரணத்திற்கு:


String regex = "\\s"; // Pattern for matching a whitespace character
String regex = "\"Windows\"";  // Pattern for matching "Windows"

நாம் "சாதாரண" எழுத்துகளாகப் பயன்படுத்த விரும்பும் சிறப்பு எழுத்துகளிலிருந்து தப்பிக்க இரட்டை பின்சாய்வுகளும் பயன்படுத்தப்பட வேண்டும். உதாரணத்திற்கு:


String regex = "How\\?";  // Pattern for matching "How?"

வடிவ வகுப்பின் முறைகள்

Patternவழக்கமான வெளிப்பாடுகளுடன் வேலை செய்வதற்கான பிற முறைகள் வகுப்பில் உள்ளன :

String pattern()‒ பொருளை உருவாக்கப் பயன்படுத்தப்படும் வழக்கமான வெளிப்பாட்டின் அசல் சரம் பிரதிநிதித்துவத்தை வழங்குகிறது Pattern:
```
Pattern pattern = Pattern.compile("abc");
System.out.println(pattern.pattern()); // "abc"
```
static boolean matches(String regex, CharSequence input)- என அனுப்பப்பட்ட உரைக்கு எதிராக ரெஜெக்ஸாக அனுப்பப்பட்ட வழக்கமான வெளிப்பாட்டை சரிபார்க்க உங்களை அனுமதிக்கிறது input. வருமானம்:

உண்மை - உரை வடிவத்துடன் பொருந்தினால்;
பொய் - அது இல்லை என்றால்;

உதாரணத்திற்கு:
```
System.out.println(Pattern.matches("A.+a","Anna")); // true
System.out.println(Pattern.matches("A.+a","Fred Anna Alexander")); // false
```
int flags()‒ பேட்டர்ன் உருவாக்கப்பட்ட போது பேட்டர்ன் அளவுரு தொகுப்பின் மதிப்பை flagsஅல்லது அளவுரு அமைக்கப்படாவிட்டால் 0 ஐ வழங்குகிறது. உதாரணத்திற்கு:
```
Pattern pattern = Pattern.compile("abc");
System.out.println(pattern.flags()); // 0
Pattern pattern = Pattern.compile("abc",Pattern.CASE_INSENSITIVE);
System.out.println(pattern.flags()); // 2
```
String[] split(CharSequence text, int limit)- அனுப்பப்பட்ட உரையை அணிவரிசையாகப் பிரிக்கிறது String. limitஉரையில் தேடப்பட்ட பொருத்தங்களின் அதிகபட்ச எண்ணிக்கையை அளவுரு குறிக்கிறது :
- பொருந்தினால் ; limit > 0_limit-1
- limit < 0உரையில் உள்ள அனைத்தும் பொருந்தினால்
- ‒ உரையில் உள்ள அனைத்து பொருத்தங்களும் இருந்தால் limit = 0, வரிசையின் முடிவில் உள்ள வெற்று சரங்கள் நிராகரிக்கப்படும்;
உதாரணத்திற்கு:
```
public static void main(String[] args) {
    String text = "Fred Anna Alexa";
    Pattern pattern = Pattern.compile("\\s");
    String[] strings = pattern.split(text,2);
    for (String s : strings) {
        System.out.println(s);
    }
    System.out.println("---------");
    String[] strings1 = pattern.split(text);
    for (String s : strings1) {
        System.out.println(s);
    }
}
```
கன்சோல் வெளியீடு:
```
Fred
Anna Alexa
---------
Fred
Anna
Alexa
```
ஒரு பொருளை உருவாக்கப் பயன்படுத்தப்படும் மற்றொரு வகுப்பின் முறைகளை கீழே கருத்தில் கொள்வோம் Matcher.

மேட்சர் வகுப்பின் முறைகள்

வகுப்பின் நிகழ்வுகள் Matcherபேட்டர்ன்-மேட்ச்சிங் செய்ய உருவாக்கப்பட்டன. Matcherவழக்கமான வெளிப்பாடுகளுக்கான "தேடுபொறி" ஆகும். ஒரு தேடலைச் செய்ய, நாம் அதற்கு இரண்டு விஷயங்களைக் கொடுக்க வேண்டும்: ஒரு முறை மற்றும் தொடக்கக் குறியீடு. Matcherஒரு பொருளை உருவாக்க , Patternவகுப்பு பின்வரும் முறையை வழங்குகிறது: рublic Matcher matcher(CharSequence input) முறை ஒரு எழுத்து வரிசையை எடுக்கும், அது தேடப்படும். இது இடைமுகத்தை செயல்படுத்தும் ஒரு வகுப்பின் உதாரணம் CharSequence. நீங்கள் ஒரு String, ஆனால் a StringBuffer, StringBuilder, Segmentஅல்லது CharBuffer. முறை என்பது ஒரு Patternபொருளாகும், அதில் matcherமுறை அழைக்கப்படுகிறது. பொருத்தியை உருவாக்குவதற்கான எடுத்துக்காட்டு:


Pattern p = Pattern.compile("a*b"); // Create a compiled representation of the regular expression
Matcher m = p.matcher("aaaaab"); // Create a "search engine" to search the text "aaaaab" for the pattern "a*b"

இப்போது நாம் பொருத்தங்களைத் தேடுவதற்கும், உரையில் பொருத்தத்தின் நிலையைப் பெறுவதற்கும், வகுப்பின் முறைகளைப் பயன்படுத்தி உரையை மாற்றுவதற்கும் எங்கள் "தேடுபொறி"யைப் பயன்படுத்தலாம். இந்த boolean find()முறை உரையில் அடுத்த பொருத்தத்தைத் தேடுகிறது. நிகழ்வு மாதிரியின் ஒரு பகுதியாக முழு உரையையும் பகுப்பாய்வு செய்ய இந்த முறை மற்றும் லூப் அறிக்கையைப் பயன்படுத்தலாம். வேறு வார்த்தைகளில் கூறுவதானால், ஒரு நிகழ்வு நிகழும்போது, அதாவது உரையில் ஒரு பொருத்தத்தைக் கண்டறியும்போது தேவையான செயல்பாடுகளை நாம் செய்யலாம். எடுத்துக்காட்டாக, உரையில் பொருத்தத்தின் நிலையைத் தீர்மானிக்க இந்த வகுப்பையும் முறைகளையும் int start()பயன்படுத்தலாம் . மற்றும் மாற்று அளவுருவின் மதிப்புடன் பொருத்தங்களை மாற்றுவதற்கு மற்றும் முறைகளைப் int end()பயன்படுத்தலாம் . உதாரணத்திற்கு: String replaceFirst(String replacement)String replaceAll(String replacement)


public static void main(String[] args) {
    String text = "Fred Anna Alexa";
    Pattern pattern = Pattern.compile("A.+?a");

    Matcher matcher = pattern.matcher(text);
    while (matcher.find()) {
        int start=matcher.start();
        int end=matcher.end();
        System.out.println("Match found: " + text.substring(start, end) + " from index "+ start + " through " + (end-1));
    }
    System.out.println(matcher.replaceFirst("Ira"));
    System.out.println(matcher.replaceAll("Mary"));
    System.out.println(text);
}

வெளியீடு:


Match found: Anna from index 5 through 8
Match found: Alexa from index 10 through 14
Fred Ira Alexa
Fred Mary Mary
Fred Anna Alexa

replaceFirstமற்றும் replaceAllமுறைகள் ஒரு புதிய பொருளை உருவாக்குகின்றன என்பதை எடுத்துக்காட்டு தெளிவுபடுத்துகிறது String- அசல் உரையில் உள்ள மாதிரி பொருத்தங்கள் ஒரு வாதமாக முறைக்கு அனுப்பப்பட்ட உரையால் மாற்றப்படும். கூடுதலாக, replaceFirstமுறை முதல் பொருத்தத்தை மட்டுமே மாற்றுகிறது, ஆனால் இந்த replaceAllமுறை உரையில் உள்ள அனைத்து பொருத்தங்களையும் மாற்றுகிறது. அசல் உரை மாறாமல் உள்ளது. மற்றும் வகுப்புகளின் அடிக்கடி Patternரீஜெக்ஸ் Matcherசெயல்பாடுகள் வகுப்பிலேயே கட்டமைக்கப்படுகின்றன String. splitஇவை , matches, replaceFirstமற்றும் போன்ற முறைகள் replaceAll. ஆனால் ஹூட்டின் கீழ், இந்த முறைகள் Patternமற்றும் Matcherவகுப்புகளைப் பயன்படுத்துகின்றன. எனவே நீங்கள் எந்த கூடுதல் குறியீட்டையும் எழுதாமல் ஒரு நிரலில் உரையை மாற்றவோ அல்லது சரங்களை ஒப்பிடவோ விரும்பினால், முறைகளைப் பயன்படுத்தவும்Stringவர்க்கம். உங்களுக்கு மேம்பட்ட அம்சங்கள் தேவைப்பட்டால், Patternமற்றும் Matcherவகுப்புகளை நினைவில் கொள்ளுங்கள்.

முடிவுரை

ஒரு ஜாவா நிரலில், வழக்கமான வெளிப்பாடு என்பது குறிப்பிட்ட வடிவ-பொருத்த விதிகளுக்குக் கீழ்ப்படியும் ஒரு சரத்தால் வரையறுக்கப்படுகிறது. குறியீட்டை இயக்கும் போது, ஜாவா இயந்திரம் இந்த சரத்தை ஒரு பொருளாக தொகுத்து , உரையில் உள்ள பொருத்தங்களைக் கண்டறிய Patternஒரு பொருளைப் பயன்படுத்துகிறது . Matcherநான் ஆரம்பத்தில் சொன்னது போல், மக்கள் பெரும்பாலும் வழக்கமான வெளிப்பாடுகளை பின்னர் தள்ளி வைக்கிறார்கள், அவை கடினமான தலைப்பு என்று கருதுகின்றனர். ஆனால் அடிப்படை தொடரியல், மெட்டாக்ராக்டர்கள் மற்றும் எழுத்து தப்பித்தல் மற்றும் வழக்கமான வெளிப்பாடுகளின் எடுத்துக்காட்டுகளைப் படித்தால், அவை முதல் பார்வையில் தோன்றுவதை விட மிகவும் எளிமையானவை என்பதை நீங்கள் காண்பீர்கள்.

மேலும் வாசிப்பு:
ஜாவா ரெஜெக்ஸ் - மேட்சர்

கருத்துக்கள்

TO VIEW ALL COMMENTS OR TO MAKE A COMMENT,
GO TO FULL VERSION