2.1 NoSQL అనే పదం యొక్క ఆవిర్భావం

ఇటీవల, "NoSQL" అనే పదం చాలా నాగరికంగా మరియు ప్రజాదరణ పొందింది, ఈ సంకేతం క్రింద అన్ని రకాల సాఫ్ట్‌వేర్ పరిష్కారాలు చురుకుగా అభివృద్ధి చేయబడుతున్నాయి మరియు ప్రచారం చేయబడుతున్నాయి. NoSQL అనేది భారీ మొత్తంలో డేటా, లీనియర్ స్కేలబిలిటీ, క్లస్టర్‌లు, ఫాల్ట్ టాలరెన్స్, నాన్ రిలేషనాలిటీకి పర్యాయపదంగా మారింది. అయినప్పటికీ, NoSQL నిల్వ అంటే ఏమిటి, ఈ పదం ఎలా కనిపించింది మరియు వారికి ఏ సాధారణ లక్షణాలు ఉన్నాయి అనే దానిపై కొంతమందికి స్పష్టమైన అవగాహన ఉంది. ఈ ఖాళీని పూరించడానికి ప్రయత్నిద్దాం.

ఈ పదం గురించి అత్యంత ఆసక్తికరమైన విషయం ఏమిటంటే, ఇది 90వ దశకం చివరిలో ఉపయోగించబడినప్పటికీ, ఇది ఇప్పుడు 2009 మధ్యలో ఉపయోగించబడుతున్న రూపంలో మాత్రమే నిజమైన అర్థాన్ని పొందింది. ప్రారంభంలో, ఇది ఓపెన్ యొక్క పేరు. కార్లో స్ట్రోజీచే సృష్టించబడిన సోర్స్ డేటాబేస్, ఇది మొత్తం డేటాను ASCII ఫైల్‌లుగా నిల్వ చేస్తుంది మరియు డేటాను యాక్సెస్ చేయడానికి SQLకి బదులుగా షెల్ స్క్రిప్ట్‌లను ఉపయోగిస్తుంది. దాని ప్రస్తుత రూపంలో "NoSQL"తో ఎటువంటి సంబంధం లేదు.

జూన్ 2009లో జోహన్ ఆస్కార్సన్ IT నిల్వ మరియు ప్రాసెసింగ్ మార్కెట్‌లో కొత్త పోకడలను చర్చించడానికి శాన్ ఫ్రాన్సిస్కోలో ఒక సమావేశాన్ని ఏర్పాటు చేశారు. సమావేశానికి ప్రధాన ప్రేరణ బిగ్ టేబుల్ మరియు డైనమో వంటి కొత్త ఓపెన్ సోర్స్ ఉత్పత్తులు. సమావేశానికి ప్రకాశవంతమైన సంకేతం కోసం, Twitter హ్యాష్‌ట్యాగ్‌కి సరిగ్గా సరిపోయే సామర్థ్యం మరియు సంక్షిప్త పదాన్ని కనుగొనడం అవసరం. ఈ నిబంధనలలో ఒకదాన్ని రాక్‌స్పేస్ నుండి ఎరిక్ ఎవాన్స్ ప్రతిపాదించారు - "NoSQL". ఈ పదం కేవలం ఒక సమావేశానికి మాత్రమే ప్రణాళిక చేయబడింది మరియు లోతైన సెమాంటిక్ లోడ్ లేదు, కానీ అది వైరల్ ప్రకటన వలె గ్లోబల్ నెట్‌వర్క్ అంతటా వ్యాపించి, IT పరిశ్రమలో మొత్తం ట్రెండ్‌కి వాస్తవ పేరుగా మారింది. మార్గం ద్వారా, వోల్డ్‌మార్ట్ (అమెజాన్ డైనమో క్లోన్), కాసాండ్రా, హెచ్‌బేస్ (గూగుల్ బిగ్‌టేబుల్ యొక్క అనలాగ్‌లు), హైపర్‌టేబుల్, కౌచ్‌డిబి, మోంగోడిబి సమావేశంలో మాట్లాడారు.

"NoSQL" అనే పదం పూర్తిగా ఆకస్మికమైనది మరియు దాని వెనుక సాధారణంగా ఆమోదించబడిన నిర్వచనం లేదా శాస్త్రీయ సంస్థ లేదని మరోసారి నొక్కి చెప్పడం విలువ. ఈ పేరు రిలేషనల్ డేటాబేస్‌లకు దూరంగా IT డెవలప్‌మెంట్ యొక్క వెక్టర్‌ను వర్ణిస్తుంది. No SQL యొక్క ప్రత్యక్ష నిర్వచనానికి మద్దతుదారులు ఉన్నప్పటికీ, ఇది SQL మాత్రమే కాదు. ప్రమోద్ సదలాజ్ మరియు మార్టిన్ ఫౌలర్ వారి ఇటీవలి పుస్తకం "NoSQL డిస్టిల్డ్"లో NoSQL ప్రపంచం గురించి జ్ఞానాన్ని సమూహపరచడానికి మరియు క్రమబద్ధీకరించడానికి ప్రయత్నించారు.

2.2 NoSQL డేటాబేస్ యొక్క ప్రాథమిక లక్షణాలు

అన్ని NoSQL కోసం కొన్ని సాధారణ లక్షణాలు ఉన్నాయి, ఎందుకంటే అనేక వైవిధ్య వ్యవస్థలు ఇప్పుడు NoSQL లేబుల్ క్రింద దాచబడ్డాయి (బహుశా అత్యంత పూర్తి జాబితాను http://nosql-database.org/లో కనుగొనవచ్చు). అనేక లక్షణాలు నిర్దిష్ట NoSQL డేటాబేస్‌లకు మాత్రమే విచిత్రంగా ఉంటాయి, జాబితా చేసేటప్పుడు నేను దీన్ని ఖచ్చితంగా ప్రస్తావిస్తాను.

1. SQL ఉపయోగించబడదు

నా ఉద్దేశ్యం ANSI SQL DML, ఎందుకంటే చాలా డేటాబేస్‌లు బాగా తెలిసిన ఇష్టమైన సింటాక్స్‌కు సమానమైన ప్రశ్న భాషలను ఉపయోగించడానికి ప్రయత్నిస్తాయి, కానీ ఎవరూ దానిని పూర్తిగా అమలు చేయలేకపోయారు మరియు విజయవంతం అయ్యే అవకాశం లేదు. SQLని అమలు చేయడానికి ప్రయత్నిస్తున్న పుకారు స్టార్టప్‌లు ఉన్నప్పటికీ, ఉదాహరణకు హడప్‌లో ( http://www.drawntoscalehq.com/ మరియు http://www.hadapt.com/ ).

2. నిర్మాణాత్మకం (స్కీమాలెస్)

అర్థం ఏమిటంటే, NoSQL డేటాబేస్‌లలో, రిలేషనల్ డేటాబేస్‌ల వలె కాకుండా, డేటా నిర్మాణం నియంత్రించబడదు (లేదా బలహీనంగా టైప్ చేయబడి ఉంటే, ప్రోగ్రామింగ్ లాంగ్వేజ్‌లతో సారూప్యతలు గీసినట్లయితే) - మీరు నిర్మాణాన్ని ముందుగా డిక్లరేటివ్‌గా మార్చకుండా ఒక ప్రత్యేక లైన్ లేదా డాక్యుమెంట్‌లో ఏకపక్ష ఫీల్డ్‌ను జోడించవచ్చు. మొత్తం పట్టికలో. అందువల్ల, డేటా మోడల్‌ను మార్చాల్సిన అవసరం ఉన్నట్లయితే, అప్లికేషన్ కోడ్‌లో మార్పును ప్రతిబింబించడం మాత్రమే తగిన చర్య.

ఉదాహరణకు, MongoDBలో ఫీల్డ్ పేరు మార్చేటప్పుడు:

BasicDBObject order = new BasicDBObject();
order.put("date", orderDate); // this field was a long time ago
order.put("totalSum", total); // before we just used "sum"

మేము అప్లికేషన్ లాజిక్‌ను మార్చినట్లయితే, మేము చదివేటప్పుడు కూడా కొత్త ఫీల్డ్‌ని ఆశిస్తున్నాము. కానీ డేటా స్కీమా లేకపోవడం వల్ల, ఇప్పటికే ఉన్న ఇతర ఆర్డర్ ఆబ్జెక్ట్‌ల నుండి totalSum ఫీల్డ్ లేదు. ఈ పరిస్థితిలో, తదుపరి చర్య కోసం రెండు ఎంపికలు ఉన్నాయి.

మొదటిది అన్ని పత్రాలను క్రాల్ చేయడం మరియు ఇప్పటికే ఉన్న అన్ని పత్రాలలో ఈ ఫీల్డ్‌ను నవీకరించడం. డేటా పరిమాణం కారణంగా, ఈ ప్రక్రియ ఎటువంటి లాక్‌లు లేకుండా జరుగుతుంది (ఆల్టర్ టేబుల్ రీనేమ్ కాలమ్ కమాండ్‌తో పోల్చవచ్చు), కాబట్టి నవీకరణ సమయంలో, ఇప్పటికే ఉన్న డేటాను ఇతర ప్రక్రియల ద్వారా చదవవచ్చు. కాబట్టి, రెండవ ఎంపిక - అప్లికేషన్ కోడ్‌లో తనిఖీ చేయడం - అనివార్యం:

BasicDBObject order = new BasicDBObject();
Double totalSum = order.getDouble("sum"); // This is the old model
if (totalSum  == null)
totalSum = order.getDouble("totalSum"); // This is the updated model

మరియు ఇప్పటికే మేము మళ్లీ రికార్డ్ చేసినప్పుడు, మేము ఈ ఫీల్డ్‌ను డేటాబేస్‌కు కొత్త ఆకృతిలో వ్రాస్తాము.

స్కీమా లేకపోవడం యొక్క ఆహ్లాదకరమైన పరిణామం చిన్న డేటాతో పని చేసే సామర్థ్యం. ఒక డాక్యుమెంట్‌లో date_published ఫీల్డ్ ఉంటే మరియు రెండవది లేకపోతే, రెండవ దాని కోసం ఖాళీ date_published ఫీల్డ్ సృష్టించబడదు. ఇది సూత్రప్రాయంగా, తార్కికం, కానీ తక్కువ స్పష్టమైన ఉదాహరణ కాలమ్-ఫ్యామిలీ NoSQL డేటాబేస్, ఇది పట్టికలు / నిలువు వరుసల యొక్క సుపరిచితమైన భావనలను ఉపయోగిస్తుంది. అయినప్పటికీ, స్కీమా లేకపోవడం వల్ల, నిలువు వరుసలు డిక్లరేటివ్‌గా ప్రకటించబడవు మరియు వినియోగదారు డేటాబేస్ సెషన్‌లో వాటిని మార్చవచ్చు/జోడించవచ్చు. ఇది ప్రత్యేకంగా, జాబితాల అమలు కోసం డైనమిక్ నిలువు వరుసల వినియోగాన్ని అనుమతిస్తుంది.

నిర్మాణాత్మక స్కీమా దాని లోపాలను కలిగి ఉంది - డేటా మోడల్‌ను మార్చేటప్పుడు అప్లికేషన్ కోడ్‌లో పైన పేర్కొన్న ఓవర్‌హెడ్‌తో పాటు - బేస్ నుండి అన్ని రకాల పరిమితులు లేకపోవడం (శూన్యం కాదు, ప్రత్యేకమైనది కాదు, నియంత్రణను తనిఖీ చేయడం మొదలైనవి), ప్లస్ అక్కడ సమాంతరంగా వివిధ ప్రాజెక్ట్‌ల డేటాబేస్‌తో పని చేస్తున్నప్పుడు నిర్మాణ డేటాను అర్థం చేసుకోవడంలో మరియు నియంత్రించడంలో అదనపు ఇబ్బందులు (డేటాబేస్ వైపు డిక్షనరీలు లేవు). అయినప్పటికీ, వేగంగా మారుతున్న ఆధునిక ప్రపంచంలో, అటువంటి వశ్యత ఇప్పటికీ ఒక ప్రయోజనం. ఒక ఉదాహరణ ట్విట్టర్, ఇది ఐదు సంవత్సరాల క్రితం, ట్వీట్‌తో పాటు, కొంచెం అదనపు సమాచారాన్ని (సమయం, ట్విట్టర్ హ్యాండిల్ మరియు మెటా-సమాచారం యొక్క మరికొన్ని బైట్‌లు) మాత్రమే నిల్వ చేసింది, కానీ ఇప్పుడు, సందేశానికి అదనంగా, మరికొన్ని కిలోబైట్‌ల మెటాడేటా డేటాబేస్‌లో నిల్వ చేయబడుతుంది.

(ఇకపై, మేము ప్రధానంగా కీ-విలువ, పత్రం మరియు కాలమ్-కుటుంబ డేటాబేస్‌ల గురించి మాట్లాడుతున్నాము, గ్రాఫ్ డేటాబేస్‌లు ఈ లక్షణాలను కలిగి ఉండకపోవచ్చు)

2.3 సముదాయాల రూపంలో డేటా ప్రాతినిధ్యం (సంకలనాలు)

సాధారణీకరణ ప్రయోజనాల కోసం అప్లికేషన్ యొక్క లాజికల్ బిజినెస్ ఎంటిటీని వివిధ భౌతిక పట్టికలలో నిల్వ చేసే రిలేషనల్ మోడల్ కాకుండా, NoSQL స్టోర్‌లు ఈ ఎంటిటీలపై సంపూర్ణ వస్తువులుగా పనిచేస్తాయి:

ఈ ఉదాహరణ ప్రామాణిక ఇ-కామర్స్ సంభావిత రిలేషనల్ మోడల్ "ఆర్డర్ - ఆర్డర్ ఐటెమ్స్ - పేమెంట్స్ - ప్రోడక్ట్" కోసం అగ్రిగేషన్‌లను ప్రదర్శిస్తుంది. రెండు సందర్భాల్లో, ఆర్డర్ ఒక లాజికల్ ఆబ్జెక్ట్‌గా పొజిషన్‌లతో కలిపి ఉంటుంది, అయితే ప్రతి స్థానం ఉత్పత్తికి లింక్‌ను నిల్వ చేస్తుంది మరియు దాని కొన్ని లక్షణాలకు, ఉదాహరణకు, పేరు (ఉత్పత్తి వస్తువును తిరిగి పొందేటప్పుడు అభ్యర్థించకుండా ఉండటానికి ఇటువంటి డీనార్మలైజేషన్ అవసరం. ఒక ఆర్డర్ - పంపిణీ వ్యవస్థల యొక్క ప్రధాన నియమం వస్తువుల మధ్య "చేరుతుంది"). ఒక మొత్తంలో, చెల్లింపులు ఆర్డర్‌తో కలిపి ఉంటాయి మరియు వస్తువు యొక్క అంతర్భాగంగా ఉంటాయి, మరొకటి అవి ప్రత్యేక వస్తువులో ఉంచబడతాయి. ఇది NoSQL డేటాబేస్‌లలో డేటా స్ట్రక్చర్‌ను రూపొందించడానికి ప్రధాన నియమాన్ని ప్రదర్శిస్తుంది - ఇది అప్లికేషన్ యొక్క అవసరాలకు కట్టుబడి ఉండాలి మరియు చాలా తరచుగా వచ్చే అభ్యర్థనల కోసం వీలైనంత వరకు ఆప్టిమైజ్ చేయాలి.

చాలా మంది అభ్యంతరం వ్యక్తం చేస్తారు, పెద్ద, తరచుగా డీనార్మలైజ్ చేయబడిన, ఆబ్జెక్ట్‌లతో పని చేయడం అనేది డేటాపై ఏకపక్ష ప్రశ్నలను ప్రయత్నించినప్పుడు అనేక సమస్యలతో నిండి ఉంటుంది, ప్రశ్నలు కంకరల నిర్మాణానికి సరిపోవు. మేము ఆర్డర్ లైన్ ఐటెమ్‌లు మరియు పేమెంట్‌లతో పాటు ఆర్డర్‌లను ఉపయోగిస్తే (యాప్ ఈ విధంగా పనిచేస్తుంది), అయితే గత నెలలో నిర్దిష్ట ఉత్పత్తికి చెందిన ఎన్ని యూనిట్లు విక్రయించబడిందో లెక్కించమని వ్యాపారం మమ్మల్ని అడుగుతుంది? ఈ సందర్భంలో, OrderItem పట్టికను స్కాన్ చేయడానికి బదులుగా (రిలేషనల్ మోడల్ విషయంలో), మేము మొత్తం ఆర్డర్‌లను NoSQL నిల్వలో తిరిగి పొందవలసి ఉంటుంది, అయినప్పటికీ మాకు ఈ సమాచారం చాలా అవసరం లేదు. దురదృష్టవశాత్తూ, ఇది పంపిణీ చేయబడిన సిస్టమ్‌లో చేయవలసిన రాజీ: మేము సాంప్రదాయ సింగిల్-సర్వర్ సిస్టమ్‌లో వలె డేటాను సాధారణీకరించలేము,

నేను పట్టికలో రెండు విధానాల యొక్క లాభాలు మరియు నష్టాలను సమూహపరచడానికి ప్రయత్నించాను: