3.1 தரவுத்தள இயல்பாக்கம்
இயல்பான வடிவம் என்பது ஒரு தொடர்புடைய தரவு மாதிரியில் உள்ள ஒரு உறவின் ஒரு பண்பு ஆகும், இது பணிநீக்கத்தின் அடிப்படையில் வகைப்படுத்துகிறது, இது தரவு மாதிரி அல்லது மாற்றத்தின் தர்க்கரீதியாக தவறான முடிவுகளுக்கு வழிவகுக்கும். இயல்பான வடிவம் என்பது ஒரு தொடர்பு (ஒரு தரவுத்தளத்தில் உள்ள அட்டவணைகள்) பூர்த்தி செய்ய வேண்டிய தேவைகளின் தொகுப்பாக வரையறுக்கப்படுகிறது.
தரவுத்தள உறவுகளை இயல்பான வடிவங்களுக்கு இணங்கும் படிவத்திற்கு மாற்றும் செயல்முறை இயல்பாக்கம் எனப்படும். இயல்பாக்கம் என்பது தரவுத்தளத்தின் கட்டமைப்பை குறைந்தபட்ச தருக்க பணிநீக்கத்தை வழங்கும் படிவத்திற்கு கொண்டு வருவதை நோக்கமாகக் கொண்டுள்ளது , மேலும் இது செயல்திறனைக் குறைக்கவோ அல்லது அதிகரிக்கவோ அல்லது தரவுத்தளத்தின் இயற்பியல் அளவைக் குறைக்கவோ அல்லது அதிகரிக்கவோ நோக்கமாக இல்லை .
தரவுத்தளத்தில் சேமிக்கப்பட்ட தகவலின் சாத்தியமான முரண்பாடுகளைக் குறைப்பதே இயல்பாக்கத்தின் இறுதி இலக்கு. இயல்பாக்குதல் செயல்முறையின் பொதுவான நோக்கம் பின்வருமாறு:
- சில வகையான பணிநீக்கங்களை விலக்குதல்;
- சில புதுப்பிப்பு முரண்பாடுகளை சரிசெய்யவும்;
- உண்மையான உலகின் போதுமான "உயர்தர" பிரதிநிதித்துவம் கொண்ட தரவுத்தள திட்டத்தின் வளர்ச்சி, உள்ளுணர்வு மற்றும் அடுத்தடுத்த விரிவாக்கத்திற்கு ஒரு நல்ல அடிப்படையாக செயல்படும்;
- தேவையான ஒருமைப்பாடு கட்டுப்பாடுகளைப் பயன்படுத்துவதற்கான நடைமுறையை எளிதாக்குதல்.
பணிநீக்கம் பொதுவாக ஒவ்வொரு உறவிலும் முதன்மை உண்மைகள் மட்டுமே சேமிக்கப்படும் வகையில் உறவுகளை சிதைப்பதன் மூலம் அகற்றப்படுகிறது (அதாவது, மற்ற சேமிக்கப்பட்ட உண்மைகளிலிருந்து பெறப்படாத உண்மைகள்).
தரவுத்தள வடிவமைப்பிற்கு இயல்பாக்குதல் யோசனைகள் மிகவும் பயனுள்ளதாக இருந்தாலும், அவை எந்த வகையிலும் தரவுத்தள வடிவமைப்பின் தரத்தை மேம்படுத்துவதற்கான உலகளாவிய அல்லது முழுமையான வழிமுறையாக இருக்காது. தரவுத்தள கட்டமைப்பில் பலவிதமான பிழைகள் மற்றும் குறைபாடுகள் இருப்பதால், அதை இயல்பாக்குவதன் மூலம் அகற்ற முடியாது.
இந்த பரிசீலனைகள் இருந்தபோதிலும், சாதாரணமயமாக்கல் கோட்பாடு தொடர்புடைய கோட்பாடு மற்றும் நடைமுறையின் மிகவும் மதிப்புமிக்க சாதனையாகும், ஏனெனில் இது தரவுத்தள திட்டத்தின் தரம் மற்றும் இந்த தரத்தை மேம்படுத்துவதற்கான முறையான முறைகளுக்கு அறிவியல் ரீதியாக கடுமையான மற்றும் நியாயமான அளவுகோல்களை வழங்குகிறது. இது மற்ற தரவு மாதிரிகளில் வழங்கப்படும் முற்றிலும் அனுபவ வடிவமைப்பு அணுகுமுறைகளிலிருந்து இயல்பாக்கக் கோட்பாட்டை தனித்து நிற்கச் செய்கிறது. மேலும், தகவல் தொழில்நுட்பத்தின் முழுத் துறையிலும் முறையான கடுமையின் அளவின் அடிப்படையில் தொடர்புடைய தரவுத்தளங்களை இயல்பாக்குவதற்கான கோட்பாட்டுடன் ஒப்பிடக்கூடிய வடிவமைப்பு தீர்வுகளை மதிப்பீடு செய்வதற்கும் மேம்படுத்துவதற்கும் நடைமுறையில் எந்த முறைகளும் இல்லை என்று வாதிடலாம்.
இயல்பாக்கம் சில சமயங்களில் "இது சாதாரண அறிவு" என்ற அடிப்படையில் விமர்சிக்கப்படுகிறது மற்றும் எந்தவொரு திறமையான நிபுணரும் சார்புக் கோட்பாட்டைப் பயன்படுத்தாமல் "இயற்கையாக" முழுமையாக இயல்பாக்கப்பட்ட தரவுத்தளத்தை வடிவமைப்பார்.
இருப்பினும், பேராசிரியர் கிறிஸ்டோபர் டேட் குறிப்பிட்டது போல, இயல்பாக்கம் என்பது ஒரு முதிர்ந்த வடிவமைப்பாளரை அவரது மனதில் வழிநடத்தும் பொது அறிவின் கொள்கைகளாகும், அதாவது, இயல்பாக்கத்தின் கொள்கைகள் முறைப்படுத்தப்பட்ட பொது அறிவு . இதற்கிடையில், பொது அறிவின் கொள்கைகளை அடையாளம் கண்டு முறைப்படுத்துவது மிகவும் கடினமான பணியாகும், மேலும் அதைத் தீர்ப்பதில் வெற்றி ஒரு குறிப்பிடத்தக்க சாதனையாகும்.
3.2 முதல் சாதாரண வடிவம்
முதல் இயல்பான வடிவம் (1NF) என்பது தொடர்புடைய தரவு மாதிரியில் உள்ள ஒரு உறவின் அடிப்படை இயல்பான வடிவமாகும்.
அந்த மாறியின் ஏதேனும் செல்லுபடியாகும் மதிப்பில், ஒவ்வொரு ரிலேஷன் டூபிளும் ஒவ்வொரு பண்புக்கூறுகளுக்கும் சரியாக ஒரு மதிப்பைக் கொண்டிருந்தால் மட்டுமே, ஒரு உறவு மாறி முதல் இயல்பான வடிவத்தில் இருக்கும்.
ஒரு தொடர்புடைய மாதிரியில், உறவின் கருத்தின் வரையறையின்படி, ஒரு உறவு எப்போதும் முதல் சாதாரண வடிவத்தில் இருக்கும்.
பல்வேறு அட்டவணைகளைப் பொறுத்தவரை, அவை உறவுகளின் சரியான பிரதிநிதித்துவங்களாக இல்லாமல் இருக்கலாம், அதன்படி, 1NF இல் இல்லாமல் இருக்கலாம். கிறிஸ்டோபர் டேட்டின் அத்தகைய வழக்குக்கான வரையறையின்படி, ஒரு அட்டவணை இயல்பாக்கப்படும் (சமமாக, முதல் சாதாரண வடிவத்தில் உள்ளது) அது சில உறவுகளின் நேரடி மற்றும் உண்மையான பிரதிநிதித்துவமாக இருந்தால் மட்டுமே. மேலும் குறிப்பாக, கேள்விக்குரிய அட்டவணை பின்வரும் ஐந்து நிபந்தனைகளை பூர்த்தி செய்ய வேண்டும்:
- மேலிருந்து கீழாக வரிசைகளை வரிசைப்படுத்துவது இல்லை (வேறுவிதமாகக் கூறினால், வரிசைகளின் வரிசை எந்த தகவலையும் தெரிவிக்காது).
- நெடுவரிசைகளை இடமிருந்து வலமாக வரிசைப்படுத்துவது இல்லை (வேறுவிதமாகக் கூறினால், நெடுவரிசைகளின் வரிசை எந்த தகவலையும் கொண்டிருக்கவில்லை).
- நகல் கோடுகள் இல்லை.
- ஒரு வரிசை மற்றும் நெடுவரிசையின் ஒவ்வொரு குறுக்குவெட்டும் தொடர்புடைய டொமைனிலிருந்து (வேறு ஒன்றுமில்லை) ஒரு மதிப்பைக் கொண்டுள்ளது.
- அனைத்து நெடுவரிசைகளும் "வழக்கமானவை".
அட்டவணையின் அனைத்து நெடுவரிசைகளின் "ஒழுங்குமுறை" என்பது, வழக்கமான நெடுவரிசைப் பெயர்களைக் குறிப்பிடுவதற்குப் பதிலாக சில சிறப்பு ஆபரேட்டரின் அழைப்பில் மட்டுமே அணுகக்கூடிய "மறைக்கப்பட்ட" கூறுகள் எதுவும் அட்டவணையில் இல்லை அல்லது வரிசைகளுக்கு பக்கவிளைவுகளுக்கு வழிவகுக்கும். அல்லது நிலையான ஆபரேட்டர்களை அழைக்கும் போது அட்டவணைகள்.
அசல் அல்லாத இயல்புநிலை (அதாவது, சில உறவுகளின் சரியான பிரதிநிதித்துவம் அல்ல) அட்டவணை:
பணியாளர் | தொலைபேசி எண் |
---|---|
இவானோவ் I.I. |
283-56-82 390-57-34 |
பெட்ரோவ் பி.பி. | 708-62-34 |
சிடோரோவ் எஸ்.எஸ். |
ஒரு அட்டவணை 1NF ஆகக் குறைக்கப்பட்டது, இது சில உறவின் சரியான பிரதிநிதித்துவமாகும்:
பணியாளர் | தொலைபேசி எண் |
---|---|
இவானோவ் I.I. | 283-56-82 |
இவானோவ் I.I. | 390-57-34 |
பெட்ரோவ் பி.பி. | 708-62-34 |
3.3 இரண்டாவது சாதாரண வடிவம்
ஒரு உறவு மாறி, அது முதல் இயல்பான வடிவத்தில் இருந்தால் மற்றும் ஒவ்வொரு முக்கிய அல்லாத பண்புக்கூறும் (ஒவ்வொரு) அதன் கேண்டிடேட் கீயையும் குறைக்கமுடியாமல் சார்ந்திருந்தால் மட்டுமே இரண்டாவது இயல்பான வடிவத்தில் இருக்கும் .
இர்ரெடசிபிலிட்டி என்பது, சாத்தியமான விசையானது இந்த செயல்பாட்டு சார்புநிலையையும் பெறக்கூடிய பண்புகளின் சிறிய துணைக்குழுவைக் கொண்டிருக்கவில்லை. குறைக்க முடியாத செயல்பாட்டு சார்புக்கு, "முழு செயல்பாட்டு சார்பு" என்ற சமமான கருத்து அடிக்கடி பயன்படுத்தப்படுகிறது.
வேட்பாளர் விசை எளிமையானது, அதாவது, அது ஒரு பண்புக்கூறைக் கொண்டிருந்தால், அதைச் சார்ந்து இருக்கும் எந்தவொரு செயல்பாட்டு சார்பும் குறைக்க முடியாதது (முழுமையானது). வேட்பாளர் விசை ஒரு கூட்டு விசையாக இருந்தால், இரண்டாவது இயல்பான படிவத்தின் வரையறையின்படி, கலவை வேட்பாளர் விசையின் ஒரு பகுதியைச் சார்ந்திருக்கும் உறவில் முக்கிய அல்லாத பண்புக்கூறுகள் இருக்கக்கூடாது.
ஒரு உறவை இரண்டாவது சாதாரண வடிவத்திற்கு மாற்றுவதற்கான எடுத்துக்காட்டு
{நிறுவனத்தின் கிளை, நிலை} ஆகிய பண்புக்கூறுகள் பின்வரும் உறவில் முதன்மை விசையாக அமைகின்றன:
நிறுவனத்தின் கிளை | வேலை தலைப்பு | சம்பளம் | கணினியின் கிடைக்கும் தன்மை |
---|---|---|---|
டாம்ஸ்கில் உள்ள கிளை | சுத்தம் செய்பவர் | 20000 | இல்லை |
மாஸ்கோவில் கிளை | புரோகிராமர் | 40000 | சாப்பிடு |
டாம்ஸ்கில் உள்ள கிளை | புரோகிராமர் | 25000 | சாப்பிடு |
சம்பளம் கிளை மற்றும் பதவியைப் பொறுத்தது, கணினி கிடைப்பது பதவியைப் பொறுத்தது என்று வைத்துக்கொள்வோம்.
ஒரு செயல்பாட்டு சார்பு நிலை உள்ளது -> ஒரு கணினியை வைத்திருத்தல், இதில் இடது பக்கம் (நிர்ணயிப்பவர்) முதன்மை விசையின் ஒரு பகுதி மட்டுமே, இது இரண்டாவது சாதாரண வடிவத்தின் நிலையை மீறுகிறது.
2NF ஆகக் குறைக்க, அசல் உறவு இரண்டு உறவுகளாக சிதைக்கப்பட வேண்டும்:
நிறுவனத்தின் கிளை | வேலை தலைப்பு | சம்பளம் |
---|---|---|
டாம்ஸ்கில் உள்ள கிளை | சுத்தம் செய்பவர் | 20000 |
மாஸ்கோவில் கிளை | புரோகிராமர் | 40000 |
டாம்ஸ்கில் உள்ள கிளை | புரோகிராமர் | 25000 |
வேலை தலைப்பு | கணினியின் கிடைக்கும் தன்மை |
---|---|
சுத்தம் செய்பவர் | இல்லை |
புரோகிராமர் | சாப்பிடு |
புரோகிராமர் | சாப்பிடு |
3.4 மூன்றாவது சாதாரண வடிவம் (3NF)
பின்வரும் நிபந்தனைகள் உண்மையாக இருந்தால் மட்டுமே R ஒரு தொடர்பு மாறி 3NF இல் இருக்கும்:
- ஆர்இரண்டாவது சாதாரண வடிவத்தில் உள்ளது.
- முக்கிய அல்லாத பண்பு இல்லைஆர்வேட்பாளர் விசையில் இடைநிலை செயல்பாட்டு சார்ந்து இல்லைஆர்.
வரையறைக்கான விளக்கங்கள்:
R உறவின் முக்கிய அல்லாத பண்புக்கூறு என்பது R இன் எந்த கேண்டிடேட் கீகளுக்கும் சொந்தமில்லாத ஒரு பண்பு ஆகும்.
X பண்புக்கூறுகளின் தொகுப்பில் Z பண்புக்கூறுகளின் தொகுப்பின் செயல்பாட்டு சார்பு (எழுதப்பட்ட X → Z, "x தீர்மானிக்கிறது z" என்று உச்சரிக்கப்படுகிறது) Y என்று X → Y மற்றும் Y → Z. இதில் X, Y மற்றும் Z ஆகிய தொகுப்புகள் எதுவும் மற்றவற்றின் துணைக்குழு அல்ல, அதாவது X → Z, X → Y, மற்றும் Y → Z ஆகியவை அற்பமானவை அல்ல, மேலும் Y → X செயல்பாட்டு சார்பு எதுவும் இல்லை.
1982 இல் கார்லோ ஜானியோலோவால் 3NF இன் வரையறை, Codd க்கு சமமான ஆனால் வித்தியாசமாக சொல்லப்பட்டது. அதன் படி, ஒரு தொடர்பு மாறி 3NF இல் இருக்கும், அதன் ஒவ்வொரு செயல்பாட்டு சார்புகளும் X → A பின்வரும் நிபந்தனைகளில் ஒன்றையாவது பூர்த்தி செய்தால் மட்டுமே:
- X இல் A உள்ளது (அதாவது, X → A என்பது ஒரு அற்பமான செயல்பாட்டு சார்பு)
- எக்ஸ் - சூப்பர் கீ
- A என்பது ஒரு முக்கிய பண்புக்கூறு (அதாவது, A என்பது வேட்பாளர் விசையின் ஒரு பகுதி).
ஜானியோலோவின் வரையறை 3NF மற்றும் மிகவும் கடுமையான Boyce-Codd Normal Form (BCNF) ஆகியவற்றுக்கு இடையே உள்ள வேறுபாட்டை தெளிவாக வரையறுக்கிறது: BCNF மூன்றாவது நிபந்தனையை விலக்குகிறது ("A என்பது ஒரு முக்கிய பண்பு").
காடின் 3NF வரையறையின் மறக்கமுடியாத மற்றும் பாரம்பரியமாக விளக்கமான சுருக்கம் பில் கென்ட்டால் வழங்கப்பட்டது: ஒவ்வொரு முக்கிய அல்லாத பண்புகளும் "சாவி, முழு விசை மற்றும் விசையைத் தவிர வேறு எதுவும் வழங்கப்பட வேண்டும் ".
முக்கிய அல்லாத பண்புக்கூறுகளின் "முழு விசையை" சார்ந்திருக்கும் நிலை, உறவு இரண்டாவது இயல்பான வடிவத்தில் இருப்பதை உறுதி செய்கிறது; மேலும் அவர்கள் "திறவுகோலைத் தவிர வேறு எதுவும்" சார்ந்து இருப்பதற்கான நிபந்தனை என்னவென்றால், அவர்கள் மூன்றாவது சாதாரண வடிவத்தில் உள்ளனர்.
கிறிஸ் டேட் கென்ட்டின் சுருக்கத்தை 3NF இன் "உள்ளுணர்வு கவர்ச்சிகரமான அம்சம்" என்று பேசுகிறார், மேலும் ஒரு சிறிய மாற்றத்துடன், இது கடுமையான பாய்ஸ்-கோட் இயல்பான வடிவத்தின் வரையறையாகவும் செயல்பட முடியும் என்பதைக் கவனிக்கிறார்: "ஒவ்வொரு பண்புக்கூறும் ஒரு விசையைப் பற்றிய தகவலை வழங்க வேண்டும். , ஒரு முழு விசை, மற்றும் சாவியைத் தவிர வேறு எதுவும் இல்லை.
3NF வரையறையின் கென்ட்டின் பதிப்பு, பாய்ஸ்-கோட் சாதாரண வடிவப் பதிப்பான டேட்டாவின் உருவாக்கத்தை விடக் குறைவான கண்டிப்பானது, ஏனெனில் முந்தையது முக்கிய அல்லாத பண்புக்கூறுகள் விசைகளைச் சார்ந்தது என்று மட்டுமே கூறுகிறது.
முதன்மை பண்புக்கூறுகள் (விசைகள் அல்லது அவற்றின் பகுதிகள்) செயல்பாடு சார்ந்து இருக்க வேண்டிய அவசியமில்லை; அவை ஒவ்வொன்றும் விசையை அல்லது அதன் பகுதியை வழங்குவதன் மூலம் விசையைப் பற்றிய தகவல்களை வழங்குகிறது. இந்த விதி முக்கிய அல்லாத பண்புக்கூறுகளுக்கு மட்டுமே செல்லுபடியாகும் என்பதை இங்கே கவனத்தில் கொள்ள வேண்டும், ஏனெனில் அனைத்து பண்புக்கூறுகளுக்கும் இதைப் பயன்படுத்துவது அனைத்து சிக்கலான மாற்று விசைகளையும் முற்றிலுமாக முடக்கும், ஏனெனில் அத்தகைய விசையின் ஒவ்வொரு உறுப்பும் "முழு விசை" நிபந்தனையை மீறும்.
ரிலேஷன் மாறி R1ஐ உதாரணமாகக் கவனியுங்கள்:
பணியாளர் | துறை | தொலைபேசி |
---|---|---|
க்ரிஷின் | கணக்கியல் | 11-22-33 |
வாசிலீவ் | கணக்கியல் | 11-22-33 |
பெட்ரோவ் | விநியோகி | 44-55-66 |
ஒவ்வொரு பணியாளரும் ஒரு துறைக்கு மட்டுமே சொந்தம்; ஒவ்வொரு துறைக்கும் ஒரு தொலைபேசி உள்ளது. பணியாளர் பண்பு முதன்மையானது. ஊழியர்களிடம் தனிப்பட்ட தொலைபேசிகள் இல்லை, மேலும் பணியாளரின் தொலைபேசி எண் துறையை மட்டுமே சார்ந்துள்ளது.
எடுத்துக்காட்டில், பின்வரும் செயல்பாட்டு சார்புகள் உள்ளன: பணியாளர் → துறை, துறை → தொலைபேசி, பணியாளர் → தொலைபேசி.
தொடர்பு மாறி R1 இரண்டாவது இயல்பான வடிவத்தில் உள்ளது, ஏனெனில் ஒவ்வொரு பண்புக்கூறும் சாத்தியமான விசை பணியாளர் மீது குறைக்க முடியாத செயல்பாட்டு சார்புநிலையைக் கொண்டுள்ளது.
பணியாளர் → ஃபோன் தொடர்பு இடைநிலையானது, எனவே உறவு மூன்றாவது சாதாரண வடிவத்தில் இல்லை.
R1 பிரித்தல் 3NF இல் உள்ள இரண்டு தொடர்பு மாறிகளில் விளைகிறது:
துறை | தொலைபேசி |
---|---|
கணக்கியல் | 11-22-33 |
விநியோகி | 44-55-66 |
பணியாளர் | துறை |
---|---|
க்ரிஷின் | கணக்கியல் |
வாசிலீவ் | கணக்கியல் |
பெட்ரோவ் | விநியோகி |
ஆரம்ப உறவு R1, தேவைப்பட்டால், R2 மற்றும் R3 உறவுகளை இணைக்கும் செயல்பாட்டின் விளைவாக எளிதாகப் பெறப்படுகிறது.
GO TO FULL VERSION