3.1 தரவுத்தள இயல்பாக்கம்

இயல்பான வடிவம் என்பது ஒரு தொடர்புடைய தரவு மாதிரியில் உள்ள ஒரு உறவின் ஒரு பண்பு ஆகும், இது பணிநீக்கத்தின் அடிப்படையில் வகைப்படுத்துகிறது, இது தரவு மாதிரி அல்லது மாற்றத்தின் தர்க்கரீதியாக தவறான முடிவுகளுக்கு வழிவகுக்கும். இயல்பான வடிவம் என்பது ஒரு தொடர்பு (ஒரு தரவுத்தளத்தில் உள்ள அட்டவணைகள்) பூர்த்தி செய்ய வேண்டிய தேவைகளின் தொகுப்பாக வரையறுக்கப்படுகிறது.

தரவுத்தள உறவுகளை இயல்பான வடிவங்களுக்கு இணங்கும் படிவத்திற்கு மாற்றும் செயல்முறை இயல்பாக்கம் எனப்படும். இயல்பாக்கம் என்பது தரவுத்தளத்தின் கட்டமைப்பை குறைந்தபட்ச தருக்க பணிநீக்கத்தை வழங்கும் படிவத்திற்கு கொண்டு வருவதை நோக்கமாகக் கொண்டுள்ளது , மேலும் இது செயல்திறனைக் குறைக்கவோ அல்லது அதிகரிக்கவோ அல்லது தரவுத்தளத்தின் இயற்பியல் அளவைக் குறைக்கவோ அல்லது அதிகரிக்கவோ நோக்கமாக இல்லை .

தரவுத்தளத்தில் சேமிக்கப்பட்ட தகவலின் சாத்தியமான முரண்பாடுகளைக் குறைப்பதே இயல்பாக்கத்தின் இறுதி இலக்கு. இயல்பாக்குதல் செயல்முறையின் பொதுவான நோக்கம் பின்வருமாறு:

  • சில வகையான பணிநீக்கங்களை விலக்குதல்;
  • சில புதுப்பிப்பு முரண்பாடுகளை சரிசெய்யவும்;
  • உண்மையான உலகின் போதுமான "உயர்தர" பிரதிநிதித்துவம் கொண்ட தரவுத்தள திட்டத்தின் வளர்ச்சி, உள்ளுணர்வு மற்றும் அடுத்தடுத்த விரிவாக்கத்திற்கு ஒரு நல்ல அடிப்படையாக செயல்படும்;
  • தேவையான ஒருமைப்பாடு கட்டுப்பாடுகளைப் பயன்படுத்துவதற்கான நடைமுறையை எளிதாக்குதல்.

பணிநீக்கம் பொதுவாக ஒவ்வொரு உறவிலும் முதன்மை உண்மைகள் மட்டுமே சேமிக்கப்படும் வகையில் உறவுகளை சிதைப்பதன் மூலம் அகற்றப்படுகிறது (அதாவது, மற்ற சேமிக்கப்பட்ட உண்மைகளிலிருந்து பெறப்படாத உண்மைகள்).

தரவுத்தள வடிவமைப்பிற்கு இயல்பாக்குதல் யோசனைகள் மிகவும் பயனுள்ளதாக இருந்தாலும், அவை எந்த வகையிலும் தரவுத்தள வடிவமைப்பின் தரத்தை மேம்படுத்துவதற்கான உலகளாவிய அல்லது முழுமையான வழிமுறையாக இருக்காது. தரவுத்தள கட்டமைப்பில் பலவிதமான பிழைகள் மற்றும் குறைபாடுகள் இருப்பதால், அதை இயல்பாக்குவதன் மூலம் அகற்ற முடியாது.

இந்த பரிசீலனைகள் இருந்தபோதிலும், சாதாரணமயமாக்கல் கோட்பாடு தொடர்புடைய கோட்பாடு மற்றும் நடைமுறையின் மிகவும் மதிப்புமிக்க சாதனையாகும், ஏனெனில் இது தரவுத்தள திட்டத்தின் தரம் மற்றும் இந்த தரத்தை மேம்படுத்துவதற்கான முறையான முறைகளுக்கு அறிவியல் ரீதியாக கடுமையான மற்றும் நியாயமான அளவுகோல்களை வழங்குகிறது. இது மற்ற தரவு மாதிரிகளில் வழங்கப்படும் முற்றிலும் அனுபவ வடிவமைப்பு அணுகுமுறைகளிலிருந்து இயல்பாக்கக் கோட்பாட்டை தனித்து நிற்கச் செய்கிறது. மேலும், தகவல் தொழில்நுட்பத்தின் முழுத் துறையிலும் முறையான கடுமையின் அளவின் அடிப்படையில் தொடர்புடைய தரவுத்தளங்களை இயல்பாக்குவதற்கான கோட்பாட்டுடன் ஒப்பிடக்கூடிய வடிவமைப்பு தீர்வுகளை மதிப்பீடு செய்வதற்கும் மேம்படுத்துவதற்கும் நடைமுறையில் எந்த முறைகளும் இல்லை என்று வாதிடலாம்.

இயல்பாக்கம் சில சமயங்களில் "இது சாதாரண அறிவு" என்ற அடிப்படையில் விமர்சிக்கப்படுகிறது மற்றும் எந்தவொரு திறமையான நிபுணரும் சார்புக் கோட்பாட்டைப் பயன்படுத்தாமல் "இயற்கையாக" முழுமையாக இயல்பாக்கப்பட்ட தரவுத்தளத்தை வடிவமைப்பார்.

இருப்பினும், பேராசிரியர் கிறிஸ்டோபர் டேட் குறிப்பிட்டது போல, இயல்பாக்கம் என்பது ஒரு முதிர்ந்த வடிவமைப்பாளரை அவரது மனதில் வழிநடத்தும் பொது அறிவின் கொள்கைகளாகும், அதாவது, இயல்பாக்கத்தின் கொள்கைகள் முறைப்படுத்தப்பட்ட பொது அறிவு . இதற்கிடையில், பொது அறிவின் கொள்கைகளை அடையாளம் கண்டு முறைப்படுத்துவது மிகவும் கடினமான பணியாகும், மேலும் அதைத் தீர்ப்பதில் வெற்றி ஒரு குறிப்பிடத்தக்க சாதனையாகும்.

3.2 முதல் சாதாரண வடிவம்

முதல் இயல்பான வடிவம் (1NF) என்பது தொடர்புடைய தரவு மாதிரியில் உள்ள ஒரு உறவின் அடிப்படை இயல்பான வடிவமாகும்.

அந்த மாறியின் ஏதேனும் செல்லுபடியாகும் மதிப்பில், ஒவ்வொரு ரிலேஷன் டூபிளும் ஒவ்வொரு பண்புக்கூறுகளுக்கும் சரியாக ஒரு மதிப்பைக் கொண்டிருந்தால் மட்டுமே, ஒரு உறவு மாறி முதல் இயல்பான வடிவத்தில் இருக்கும்.

ஒரு தொடர்புடைய மாதிரியில், உறவின் கருத்தின் வரையறையின்படி, ஒரு உறவு எப்போதும் முதல் சாதாரண வடிவத்தில் இருக்கும்.

பல்வேறு அட்டவணைகளைப் பொறுத்தவரை, அவை உறவுகளின் சரியான பிரதிநிதித்துவங்களாக இல்லாமல் இருக்கலாம், அதன்படி, 1NF இல் இல்லாமல் இருக்கலாம். கிறிஸ்டோபர் டேட்டின் அத்தகைய வழக்குக்கான வரையறையின்படி, ஒரு அட்டவணை இயல்பாக்கப்படும் (சமமாக, முதல் சாதாரண வடிவத்தில் உள்ளது) அது சில உறவுகளின் நேரடி மற்றும் உண்மையான பிரதிநிதித்துவமாக இருந்தால் மட்டுமே. மேலும் குறிப்பாக, கேள்விக்குரிய அட்டவணை பின்வரும் ஐந்து நிபந்தனைகளை பூர்த்தி செய்ய வேண்டும்:

  • மேலிருந்து கீழாக வரிசைகளை வரிசைப்படுத்துவது இல்லை (வேறுவிதமாகக் கூறினால், வரிசைகளின் வரிசை எந்த தகவலையும் தெரிவிக்காது).
  • நெடுவரிசைகளை இடமிருந்து வலமாக வரிசைப்படுத்துவது இல்லை (வேறுவிதமாகக் கூறினால், நெடுவரிசைகளின் வரிசை எந்த தகவலையும் கொண்டிருக்கவில்லை).
  • நகல் கோடுகள் இல்லை.
  • ஒரு வரிசை மற்றும் நெடுவரிசையின் ஒவ்வொரு குறுக்குவெட்டும் தொடர்புடைய டொமைனிலிருந்து (வேறு ஒன்றுமில்லை) ஒரு மதிப்பைக் கொண்டுள்ளது.
  • அனைத்து நெடுவரிசைகளும் "வழக்கமானவை".

அட்டவணையின் அனைத்து நெடுவரிசைகளின் "ஒழுங்குமுறை" என்பது, வழக்கமான நெடுவரிசைப் பெயர்களைக் குறிப்பிடுவதற்குப் பதிலாக சில சிறப்பு ஆபரேட்டரின் அழைப்பில் மட்டுமே அணுகக்கூடிய "மறைக்கப்பட்ட" கூறுகள் எதுவும் அட்டவணையில் இல்லை அல்லது வரிசைகளுக்கு பக்கவிளைவுகளுக்கு வழிவகுக்கும். அல்லது நிலையான ஆபரேட்டர்களை அழைக்கும் போது அட்டவணைகள்.

அசல் அல்லாத இயல்புநிலை (அதாவது, சில உறவுகளின் சரியான பிரதிநிதித்துவம் அல்ல) அட்டவணை:

பணியாளர் தொலைபேசி எண்
இவானோவ் I.I.

283-56-82

390-57-34

பெட்ரோவ் பி.பி. 708-62-34
சிடோரோவ் எஸ்.எஸ்.

ஒரு அட்டவணை 1NF ஆகக் குறைக்கப்பட்டது, இது சில உறவின் சரியான பிரதிநிதித்துவமாகும்:

பணியாளர் தொலைபேசி எண்
இவானோவ் I.I. 283-56-82
இவானோவ் I.I. 390-57-34
பெட்ரோவ் பி.பி. 708-62-34

3.3 இரண்டாவது சாதாரண வடிவம்

ஒரு உறவு மாறி, அது முதல் இயல்பான வடிவத்தில் இருந்தால் மற்றும் ஒவ்வொரு முக்கிய அல்லாத பண்புக்கூறும் (ஒவ்வொரு) அதன் கேண்டிடேட் கீயையும் குறைக்கமுடியாமல் சார்ந்திருந்தால் மட்டுமே இரண்டாவது இயல்பான வடிவத்தில் இருக்கும் .

இர்ரெடசிபிலிட்டி என்பது, சாத்தியமான விசையானது இந்த செயல்பாட்டு சார்புநிலையையும் பெறக்கூடிய பண்புகளின் சிறிய துணைக்குழுவைக் கொண்டிருக்கவில்லை. குறைக்க முடியாத செயல்பாட்டு சார்புக்கு, "முழு செயல்பாட்டு சார்பு" என்ற சமமான கருத்து அடிக்கடி பயன்படுத்தப்படுகிறது.

வேட்பாளர் விசை எளிமையானது, அதாவது, அது ஒரு பண்புக்கூறைக் கொண்டிருந்தால், அதைச் சார்ந்து இருக்கும் எந்தவொரு செயல்பாட்டு சார்பும் குறைக்க முடியாதது (முழுமையானது). வேட்பாளர் விசை ஒரு கூட்டு விசையாக இருந்தால், இரண்டாவது இயல்பான படிவத்தின் வரையறையின்படி, கலவை வேட்பாளர் விசையின் ஒரு பகுதியைச் சார்ந்திருக்கும் உறவில் முக்கிய அல்லாத பண்புக்கூறுகள் இருக்கக்கூடாது.

ஒரு உறவை இரண்டாவது சாதாரண வடிவத்திற்கு மாற்றுவதற்கான எடுத்துக்காட்டு

{நிறுவனத்தின் கிளை, நிலை} ஆகிய பண்புக்கூறுகள் பின்வரும் உறவில் முதன்மை விசையாக அமைகின்றன:

ஆர்
நிறுவனத்தின் கிளை வேலை தலைப்பு சம்பளம் கணினியின் கிடைக்கும் தன்மை
டாம்ஸ்கில் உள்ள கிளை சுத்தம் செய்பவர் 20000 இல்லை
மாஸ்கோவில் கிளை புரோகிராமர் 40000 சாப்பிடு
டாம்ஸ்கில் உள்ள கிளை புரோகிராமர் 25000 சாப்பிடு

சம்பளம் கிளை மற்றும் பதவியைப் பொறுத்தது, கணினி கிடைப்பது பதவியைப் பொறுத்தது என்று வைத்துக்கொள்வோம்.

ஒரு செயல்பாட்டு சார்பு நிலை உள்ளது -> ஒரு கணினியை வைத்திருத்தல், இதில் இடது பக்கம் (நிர்ணயிப்பவர்) முதன்மை விசையின் ஒரு பகுதி மட்டுமே, இது இரண்டாவது சாதாரண வடிவத்தின் நிலையை மீறுகிறது.

2NF ஆகக் குறைக்க, அசல் உறவு இரண்டு உறவுகளாக சிதைக்கப்பட வேண்டும்:

R1
நிறுவனத்தின் கிளை வேலை தலைப்பு சம்பளம்
டாம்ஸ்கில் உள்ள கிளை சுத்தம் செய்பவர் 20000
மாஸ்கோவில் கிளை புரோகிராமர் 40000
டாம்ஸ்கில் உள்ள கிளை புரோகிராமர் 25000
R2
வேலை தலைப்பு கணினியின் கிடைக்கும் தன்மை
சுத்தம் செய்பவர் இல்லை
புரோகிராமர் சாப்பிடு
புரோகிராமர் சாப்பிடு

3.4 மூன்றாவது சாதாரண வடிவம் (3NF)

பின்வரும் நிபந்தனைகள் உண்மையாக இருந்தால் மட்டுமே R ஒரு தொடர்பு மாறி 3NF இல் இருக்கும்:

  • ஆர்இரண்டாவது சாதாரண வடிவத்தில் உள்ளது.
  • முக்கிய அல்லாத பண்பு இல்லைஆர்வேட்பாளர் விசையில் இடைநிலை செயல்பாட்டு சார்ந்து இல்லைஆர்.

வரையறைக்கான விளக்கங்கள்:

R உறவின் முக்கிய அல்லாத பண்புக்கூறு என்பது R இன் எந்த கேண்டிடேட் கீகளுக்கும் சொந்தமில்லாத ஒரு பண்பு ஆகும்.

X பண்புக்கூறுகளின் தொகுப்பில் Z பண்புக்கூறுகளின் தொகுப்பின் செயல்பாட்டு சார்பு (எழுதப்பட்ட X → Z, "x தீர்மானிக்கிறது z" என்று உச்சரிக்கப்படுகிறது) Y என்று X → Y மற்றும் Y → Z. இதில் X, Y மற்றும் Z ஆகிய தொகுப்புகள் எதுவும் மற்றவற்றின் துணைக்குழு அல்ல, அதாவது X → Z, X → Y, மற்றும் Y → Z ஆகியவை அற்பமானவை அல்ல, மேலும் Y → X செயல்பாட்டு சார்பு எதுவும் இல்லை.

1982 இல் கார்லோ ஜானியோலோவால் 3NF இன் வரையறை, Codd க்கு சமமான ஆனால் வித்தியாசமாக சொல்லப்பட்டது. அதன் படி, ஒரு தொடர்பு மாறி 3NF இல் இருக்கும், அதன் ஒவ்வொரு செயல்பாட்டு சார்புகளும் X → A பின்வரும் நிபந்தனைகளில் ஒன்றையாவது பூர்த்தி செய்தால் மட்டுமே:

  • X இல் A உள்ளது (அதாவது, X → A என்பது ஒரு அற்பமான செயல்பாட்டு சார்பு)
  • எக்ஸ் - சூப்பர் கீ
  • A என்பது ஒரு முக்கிய பண்புக்கூறு (அதாவது, A என்பது வேட்பாளர் விசையின் ஒரு பகுதி).

ஜானியோலோவின் வரையறை 3NF மற்றும் மிகவும் கடுமையான Boyce-Codd Normal Form (BCNF) ஆகியவற்றுக்கு இடையே உள்ள வேறுபாட்டை தெளிவாக வரையறுக்கிறது: BCNF மூன்றாவது நிபந்தனையை விலக்குகிறது ("A என்பது ஒரு முக்கிய பண்பு").

காடின் 3NF வரையறையின் மறக்கமுடியாத மற்றும் பாரம்பரியமாக விளக்கமான சுருக்கம் பில் கென்ட்டால் வழங்கப்பட்டது: ஒவ்வொரு முக்கிய அல்லாத பண்புகளும் "சாவி, முழு விசை மற்றும் விசையைத் தவிர வேறு எதுவும் வழங்கப்பட வேண்டும் ".

முக்கிய அல்லாத பண்புக்கூறுகளின் "முழு விசையை" சார்ந்திருக்கும் நிலை, உறவு இரண்டாவது இயல்பான வடிவத்தில் இருப்பதை உறுதி செய்கிறது; மேலும் அவர்கள் "திறவுகோலைத் தவிர வேறு எதுவும்" சார்ந்து இருப்பதற்கான நிபந்தனை என்னவென்றால், அவர்கள் மூன்றாவது சாதாரண வடிவத்தில் உள்ளனர்.

கிறிஸ் டேட் கென்ட்டின் சுருக்கத்தை 3NF இன் "உள்ளுணர்வு கவர்ச்சிகரமான அம்சம்" என்று பேசுகிறார், மேலும் ஒரு சிறிய மாற்றத்துடன், இது கடுமையான பாய்ஸ்-கோட் இயல்பான வடிவத்தின் வரையறையாகவும் செயல்பட முடியும் என்பதைக் கவனிக்கிறார்: "ஒவ்வொரு பண்புக்கூறும் ஒரு விசையைப் பற்றிய தகவலை வழங்க வேண்டும். , ஒரு முழு விசை, மற்றும் சாவியைத் தவிர வேறு எதுவும் இல்லை.

3NF வரையறையின் கென்ட்டின் பதிப்பு, பாய்ஸ்-கோட் சாதாரண வடிவப் பதிப்பான டேட்டாவின் உருவாக்கத்தை விடக் குறைவான கண்டிப்பானது, ஏனெனில் முந்தையது முக்கிய அல்லாத பண்புக்கூறுகள் விசைகளைச் சார்ந்தது என்று மட்டுமே கூறுகிறது.

முதன்மை பண்புக்கூறுகள் (விசைகள் அல்லது அவற்றின் பகுதிகள்) செயல்பாடு சார்ந்து இருக்க வேண்டிய அவசியமில்லை; அவை ஒவ்வொன்றும் விசையை அல்லது அதன் பகுதியை வழங்குவதன் மூலம் விசையைப் பற்றிய தகவல்களை வழங்குகிறது. இந்த விதி முக்கிய அல்லாத பண்புக்கூறுகளுக்கு மட்டுமே செல்லுபடியாகும் என்பதை இங்கே கவனத்தில் கொள்ள வேண்டும், ஏனெனில் அனைத்து பண்புக்கூறுகளுக்கும் இதைப் பயன்படுத்துவது அனைத்து சிக்கலான மாற்று விசைகளையும் முற்றிலுமாக முடக்கும், ஏனெனில் அத்தகைய விசையின் ஒவ்வொரு உறுப்பும் "முழு விசை" நிபந்தனையை மீறும்.

ரிலேஷன் மாறி R1ஐ உதாரணமாகக் கவனியுங்கள்:

R1
பணியாளர் துறை தொலைபேசி
க்ரிஷின் கணக்கியல் 11-22-33
வாசிலீவ் கணக்கியல் 11-22-33
பெட்ரோவ் விநியோகி 44-55-66

ஒவ்வொரு பணியாளரும் ஒரு துறைக்கு மட்டுமே சொந்தம்; ஒவ்வொரு துறைக்கும் ஒரு தொலைபேசி உள்ளது. பணியாளர் பண்பு முதன்மையானது. ஊழியர்களிடம் தனிப்பட்ட தொலைபேசிகள் இல்லை, மேலும் பணியாளரின் தொலைபேசி எண் துறையை மட்டுமே சார்ந்துள்ளது.

எடுத்துக்காட்டில், பின்வரும் செயல்பாட்டு சார்புகள் உள்ளன: பணியாளர் → துறை, துறை → தொலைபேசி, பணியாளர் → தொலைபேசி.

தொடர்பு மாறி R1 இரண்டாவது இயல்பான வடிவத்தில் உள்ளது, ஏனெனில் ஒவ்வொரு பண்புக்கூறும் சாத்தியமான விசை பணியாளர் மீது குறைக்க முடியாத செயல்பாட்டு சார்புநிலையைக் கொண்டுள்ளது.

பணியாளர் → ஃபோன் தொடர்பு இடைநிலையானது, எனவே உறவு மூன்றாவது சாதாரண வடிவத்தில் இல்லை.

R1 பிரித்தல் 3NF இல் உள்ள இரண்டு தொடர்பு மாறிகளில் விளைகிறது:

R2
துறை தொலைபேசி
கணக்கியல் 11-22-33
விநியோகி 44-55-66

R3
பணியாளர் துறை
க்ரிஷின் கணக்கியல்
வாசிலீவ் கணக்கியல்
பெட்ரோவ் விநியோகி

ஆரம்ப உறவு R1, தேவைப்பட்டால், R2 மற்றும் R3 உறவுகளை இணைக்கும் செயல்பாட்டின் விளைவாக எளிதாகப் பெறப்படுகிறது.