CodeGym /Java Blog /यादृच्छिक /जावा आणि बिग डेटा: बिग डेटा प्रकल्प जावाशिवाय का करू शकत ...
John Squirrels
पातळी 41
San Francisco

जावा आणि बिग डेटा: बिग डेटा प्रकल्प जावाशिवाय का करू शकत नाहीत

यादृच्छिक या ग्रुपमध्ये प्रकाशित केले
CodeGym वरील आमच्या लेखांमध्ये, जावा, जो आता 25 वर्षांचा आहे, नूतनीकरण लोकप्रियतेचा आनंद घेत आहे आणि नजीकच्या भविष्यात उज्ज्वल संभावना आहे हे सांगताना आम्ही कधीही कंटाळलो नाही. याची अनेक कारणे आहेत. त्यापैकी एक अशी आहे की जावा ही बर्‍याच ट्रेंडिंग आयटी मार्केटमधील मुख्य प्रोग्रामिंग भाषा आहे जी वेगाने लोकप्रिय होत आहे. जावा आणि बिग डेटा: बिग डेटा प्रकल्प जावाशिवाय का करू शकत नाहीत - 1 इंटरनेट ऑफ थिंग्ज (IoT) आणि मोठा डेटा, तसेच बिझनेस इंटेलिजन्स (BI), आणि रिअल-टाइम अॅनालिटिक्सचा उल्लेख बहुतेक वेळा जावाबद्दल खोल आपुलकी आणि कोमल भावनांच्या संदर्भात केला जातो. अलीकडे, आम्ही जावा आणि इंटरनेट ऑफ थिंग्जमधील संबंध शोधलेआणि जावा डेव्हलपर आपली कौशल्ये या कोनाड्यात कशी तयार करू शकतो याबद्दल बोललो. आता आम्ही आमचे लक्ष आणखी एका सुपर ट्रेंडिंग क्षेत्राकडे वळवतो - ज्याचा तुम्ही अंदाज लावला होता - जावा देखील आवडतो आणि त्याशिवाय जगू शकत नाही. तर, आज आपण मोठ्या डेटाच्या संदर्भात खालील प्रश्न एक्सप्लोर करू: जावा, आणि म्हणून निष्ठावान जावा कोडर, या कोनाडामध्ये देखील लोकप्रिय का आहे? मोठ्या डेटा प्रकल्पांमध्ये Java नक्की कसा वापरला जातो? या कोनाडामध्ये नोकरीसाठी पात्र होण्यासाठी तुम्ही काय शिकले पाहिजे? आणि बिग डेटामध्ये सध्याचे ट्रेंड काय आहेत? आणि या सगळ्या दरम्यान, आम्ही बिग डेटावरील जगातील शीर्ष तज्ञांची मते पाहू, ज्यामुळे होमर सिम्पसनला देखील मोठ्या डेटासह कार्य करण्याची इच्छा होईल. जावा आणि बिग डेटा: बिग डेटा प्रकल्प Java शिवाय का करू शकत नाहीत - 2

https://ru.wikipedia.org/wiki/Homer_Goes_to_College

"मी म्हणत राहिलो की पुढच्या दहा वर्षात सेक्सी जॉब सांख्यिकीशास्त्रज्ञ असेल. लोकांना वाटते की मी विनोद करतोय, पण संगणक अभियंता ही १९९० च्या दशकातील सेक्सी नोकरी असेल असा अंदाज कोणी बांधला असेल?"

बिग डेटा ग्रह जिंकत आहे

परंतु प्रथम, मोठ्या डेटाबद्दल थोडेसे आणि हे कोनाडे करियर तयार करण्यासाठी इतके आशादायक का आहे. थोडक्यात, मोठा डेटा असह्यपणे, स्थिरपणे आणि (सर्वात महत्त्वाचे म्हणजे) जगभरातील कंपन्यांच्या व्यवसाय प्रक्रियेत खूप लवकर प्रवेश करतो. त्या कंपन्यांना, डेटा सायन्स प्रोफेशनल्स (फक्त प्रोग्रामरच नव्हे) शोधण्यास भाग पाडले जात आहे, त्यांना उच्च पगार आणि इतर भत्ते देण्याचे आमिष दाखवून. फोर्ब्सच्या मते, व्यवसायांमध्ये मोठ्या डेटाचा वापर वाढला आहे2015 मध्ये 17% वरून 2018 मध्ये 59% पर्यंत. बिग डेटा विक्री, विपणन, संशोधन आणि विकास, लॉजिस्टिक आणि इतर सर्व गोष्टींसह अर्थव्यवस्थेच्या विविध क्षेत्रांमध्ये वेगाने पसरत आहे. IBM च्या संशोधनानुसार, एकट्या युनायटेड स्टेट्समध्ये 2020 पर्यंत या क्षेत्रातील व्यावसायिकांसाठी नोकऱ्यांची संख्या 2.7 दशलक्षांपेक्षा जास्त होईल. आश्वासक? तू पैज लाव.

मोठा डेटा आणि Java

मग आता, बिग डेटा आणि जावा मध्ये इतके साम्य का आहे? गोष्ट अशी आहे की मोठ्या डेटासाठी अनेक मुख्य साधने Java मध्ये लिहिलेली आहेत. इतकेच काय, ही जवळपास सर्व साधने ओपन सोर्स प्रकल्प आहेत. याचा अर्थ ते प्रत्येकासाठी उपलब्ध आहेत आणि त्यानुसार जगभरातील सर्वात मोठ्या आयटी कंपन्यांद्वारे सक्रियपणे वापरले जातात. "बर्‍याच प्रमाणात बिग डेटा जावा आहे. Hadoop आणि Hadoop इकोसिस्टमची मोठी टक्केवारी Java मध्ये लिहिलेली आहे. Hadoop साठी मूळ MapReduce इंटरफेस जावा आहे. त्यामुळे तुम्ही जावा सोल्यूशन्स तयार करून सहजपणे मोठ्या डेटामध्ये जाऊ शकता. Hadoop चे. कॅस्केडिंग सारख्या Java लायब्ररी देखील आहेत ज्यामुळे काम सोपे होते. तुम्ही Hive सारखे काहीतरी वापरत असलात तरीही जावा गोष्टी डीबग करण्यासाठी खरोखर उपयुक्त आहे." म्हणालामार्किन मेजरन, डेटा शास्त्रज्ञ आणि डेटा विकासाचे उपाध्यक्ष आठ. "हडूपच्या पलीकडे, स्टॉर्म जावा आणि स्पार्कमध्ये लिहिलेले आहे (म्हणजे: हॅडूप कंप्युटिंगचे भविष्य) स्कालामध्ये आहे (जे JVM वर चालते आणि स्पार्कमध्ये जावा इंटरफेस आहे). त्यामुळे Java मोठ्या डेटा स्पेसच्या मोठ्या टक्केवारीला कव्हर करते, "तज्ज्ञ जोडतात. तुम्ही बघू शकता, जावाचे ज्ञान मोठ्या डेटामध्ये, इंटरनेट ऑफ थिंग्ज, मशीन लर्निंग आणि लोकप्रियता मिळवत असलेल्या इतर अनेक कोनाड्यांमध्ये फक्त न बदलता येणारे असेल.
"प्रत्येक कंपनीकडे भविष्यात मोठा डेटा असतो आणि प्रत्येक कंपनी शेवटी डेटा व्यवसायात असेल."
आणि आता वर नमूद केलेल्या बिग डेटा टूल्सबद्दल थोडे अधिक, जे जावा डेव्हलपर्सद्वारे मोठ्या प्रमाणावर वापरले जाते.

अपाचे हडूप

Apache Hadoop हे मोठ्या डेटासाठी मूलभूत तंत्रज्ञानांपैकी एक आहे आणि ते Java मध्ये लिहिलेले आहे. Hadoop हा Apache Software Foundation द्वारे व्यवस्थापित युटिलिटीज, लायब्ररी आणि फ्रेमवर्कचा विनामूल्य, मुक्त स्रोत संच आहे. मूलतः स्केलेबल, वितरीत आणि दोष-सहिष्णु संगणनासाठी तसेच मोठ्या प्रमाणात विविध माहिती संचयित करण्यासाठी तयार केलेले, Hadoop नैसर्गिकरित्या अनेक कंपन्यांसाठी मोठ्या डेटा पायाभूत सुविधांचा केंद्रबिंदू बनत आहे. जगभरातील कंपन्या सक्रियपणे हडूप तज्ञ शोधत आहेत आणि या तंत्रज्ञानावर प्रभुत्व मिळविण्यासाठी जावा हे एक महत्त्वाचे कौशल्य आहे. Slashdot वर विकसकांच्या मते, 2019 मध्ये, जेपी मॉर्गन चेससह अनेक मोठ्या कंपन्यांनी, प्रोग्रामरसाठी त्यांच्या विक्रमी पगारासह, हडूप वर्ल्ड कॉन्फरन्समध्ये सक्रियपणे हडूप तज्ञांची मागणी केली, परंतु तेथेही, त्यांना आवश्यक कौशल्ये (विशेषतः, ज्ञान) असलेले पुरेसे तज्ञ सापडले नाहीत. Hadoop MapReduce प्रोग्रामिंग मॉडेल आणि फ्रेमवर्कचे). म्हणजे या क्षेत्रातील पगार आणखी वाढतील. आणि ते आधीच खूप मोठे आहेत. विशेषतः, बिझनेस इनसाइडरचा अंदाज आहे की सरासरी हडूप तज्ञाची किंमत प्रति वर्ष $103,000 आहे, तर मोठ्या डेटा तज्ञांची सरासरी किंमत प्रति वर्ष $106,000 आहे. हॅडूप तज्ञ शोधत असलेले रिक्रूटर्स जावाला यशस्वी रोजगारासाठी सर्वात महत्वाचे कौशल्य म्हणून हायलाइट करतात. IBM, Microsoft आणि Oracle यासह अनेक मोठ्या कॉर्पोरेशन्सद्वारे हडूपचा बराच काळ वापर केला जात आहे किंवा तुलनेने अलीकडेच सादर केला गेला आहे. या क्षणी,
"जेथे डेटाचा धूर आहे, तिथे व्यवसायात आग आहे."
डॉ. थॉमस रेडमन ,
डेटा विश्लेषण आणि डिजिटल तंत्रज्ञानातील एक प्रसिद्ध तज्ञ

अपाचे स्पार्क

Apache Spark हा आणखी एक महत्त्वाचा मोठा डेटा प्लॅटफॉर्म आहे जो हडूपचा गंभीर प्रतिस्पर्धी आहे. वेग, लवचिकता आणि विकासकांच्या सोयीमुळे, Apache Spark हे SQL, पॅकेट-स्विच केलेला आणि प्रवाहित डेटा आणि मशीन लर्निंगमध्ये मोठ्या प्रमाणात विकासासाठी अग्रगण्य वातावरण बनत आहे. वितरित बिग डेटा प्रोसेसिंगसाठी फ्रेमवर्क म्हणून, Apache Spark हे Hadoop MapReduce फ्रेमवर्क प्रमाणे काम करते आणि हळूहळू MapReduce मोठ्या डेटामध्ये त्याची प्रमुखता लुटत आहे. स्पार्कचा वापर वेगवेगळ्या प्रकारे केला जाऊ शकतो. यात Java साठी API आहे, तसेच इतर अनेक प्रोग्रामिंग भाषा, जसे की Scala, Python आणि R. आज, Spark मोठ्या प्रमाणावर बँका, दूरसंचार कंपन्या, व्हिडिओ गेम डेव्हलपर आणि अगदी सरकारद्वारे वापरले जाते. साहजिकच, अॅपल, फेसबुक, आयबीएम आणि मायक्रोसॉफ्टसारख्या आयटी दिग्गजांना अपाचे स्पार्क आवडते.

अपाचे माहूत

Apache Mahout ही Apache ची ओपन सोर्स Java मशीन लर्निंग लायब्ररी आहे. हे एक स्केलेबल मशीन लर्निंग टूल आहे जे एक किंवा अधिक मशीनवर डेटावर प्रक्रिया करू शकते. मशीन लर्निंग अंमलबजावणी Java मध्ये लिहिलेली आहे आणि काही भाग Apache Hadoop वर तयार केले आहेत.

अपाचे वादळ

Apache Storm हे रिअल टाइममध्ये वितरित प्रवाह प्रक्रियेसाठी एक फ्रेमवर्क आहे. स्टॉर्म अमर्यादित डेटा प्रवाहांची दोष-सहिष्णु प्रक्रिया सुलभ करते, डेटा पॅकेटसाठी हडूप जे करते ते रिअल टाइममध्ये करते. वादळ कोणत्याही रांग प्रणाली आणि कोणत्याही डेटाबेस प्रणालीसह समाकलित होते.

Java JFreeChart

Java JFreeChart ही Java मध्ये विकसित केलेली मुक्त स्रोत लायब्ररी आहे आणि विविध प्रकारचे तक्ते तयार करण्यासाठी Java-आधारित अनुप्रयोगांमध्ये वापरण्यासाठी डिझाइन केलेले आहे. वस्तुस्थिती अशी आहे की मोठ्या डेटाचे यशस्वीरित्या विश्लेषण करण्यासाठी डेटा व्हिज्युअलायझेशन खूप महत्वाचे आहे. मोठ्या डेटामध्ये मोठ्या प्रमाणात डेटासह कार्य करणे समाविष्ट असल्यामुळे, ट्रेंड ओळखणे किंवा कच्चा डेटा पाहून विशिष्ट निष्कर्षापर्यंत पोहोचणे कठीण होऊ शकते. परंतु, जर तोच डेटा चार्टमध्ये प्रदर्शित केला असेल तर तो अधिक समजण्याजोगा होतो. नमुने शोधणे आणि सहसंबंध ओळखणे सोपे आहे. हे जसे घडते, Java JFreeChart मोठ्या डेटा विश्लेषणासाठी आलेख आणि चार्ट तयार करण्यात मदत करते.

डीपलर्निंग4जे

Deeplearning4j ही Java लायब्ररी आहे जी विविध प्रकारचे न्यूरल नेटवर्क तयार करण्यासाठी वापरली जाते. Deeplearning4j Java मध्ये लागू केले आहे आणि JVM मध्ये चालते. हे Clojure शी सुसंगत देखील आहे आणि Scala भाषेसाठी API समाविष्ट करते. Deeplearning4j मध्ये प्रतिबंधित बोल्ट्झमन मशीन, डीप बिलीफ नेटवर्क, डीप ऑटोएनकोडर, स्टॅक्ड डिनोईझिंग ऑटोएनकोडर, रिकर्सिव्ह न्यूरल टेन्सर नेटवर्क, word2vec, doc2vec आणि GloVe यांचा समावेश आहे.
"डेटा व्यवसायासाठी नवीन कच्चा माल बनत आहे."

2020 च्या उंबरठ्यावरील बिग डेटा: सर्वात नवीन ट्रेंड

2020 हे बिग डेटासाठी वेगवान वाढ आणि उत्क्रांतीचे आणखी एक वर्ष असले पाहिजे, तसेच विविध क्षेत्रातील कंपन्या आणि संस्थांद्वारे मोठ्या डेटाचा व्यापक अवलंब करणे आवश्यक आहे. तर, पुढच्या वर्षी महत्त्वाची भूमिका बजावणारे बिग डेटामधील ट्रेंड थोडक्यात हायलाइट करूया. जावा आणि बिग डेटा: बिग डेटा प्रकल्प Java शिवाय का करू शकत नाहीत - 3

https://www.arnnet.com.au/slideshow/553034/pictures-our-10-favourite-techie-simpsons-episodes-moments/

इंटरनेट ऑफ थिंग्ज - मोठा डेटा मोठा होत आहे

इंटरनेट ऑफ थिंग्ज (IoT) कदाचित ऑफ-टॉपिकसारखे वाटू शकते, परंतु हे तसे नाही. IoT हा "ट्रेंड" चालू ठेवतो कारण तो गती मिळवतो आणि जगभर पसरतो. परिणामी, घरे आणि कार्यालयांमध्ये स्थापित "स्मार्ट" उपकरणांची संख्या देखील वाढत आहे. जसे पाहिजे तसे, ही उपकरणे सर्व प्रकारचा डेटा पाठवत आहेत जिथे जाण्याची आवश्यकता आहे. याचा अर्थ बिग डेटाची मात्रा फक्त वाढेल. तज्ञांच्या मते, बर्‍याच संस्थांकडे आधीपासूनच भरपूर डेटा आहे, प्रामुख्याने IoT कडून, जो वापरण्यासाठी ते तयार नाहीत. 2020 मध्ये, हा डेटा हिमस्खलन आणखी मोठा होईल. परिणामी, बिग डेटा प्रकल्पांमधील गुंतवणूकही वेगाने वाढेल. आणि लक्षात ठेवा, IoT ला Java खूप आवडते . कोणाला ते आवडत नाही?

डिजिटल जुळे

डिजिटल जुळे हा आणखी एक मनोरंजक ट्रेंड आहे जो थेट इंटरनेट ऑफ थिंग्ज आणि बिग डेटाशी संबंधित आहे. त्यानुसार, जावा येथे थोडासा वापर दिसेल. डिजिटल ट्विन म्हणजे काय? ही वास्तविक वस्तू किंवा प्रणालीची डिजिटल प्रतिकृती आहे. भौतिक उपकरणाचे डिजिटल अॅनालॉग वास्तविक ऑब्जेक्टच्या अंतर्गत प्रक्रिया, तांत्रिक वैशिष्ट्ये आणि हस्तक्षेप आणि त्याच्या वातावरणाच्या प्रभावाखाली वर्तनाचे अनुकरण करणे शक्य करते. डिजिटल ट्विन समांतरपणे कार्यरत असलेल्या वास्तविक उपकरणामध्ये मोठ्या संख्येने सेन्सरशिवाय कार्य करू शकत नाही. 2020 पर्यंत, अशी अपेक्षा आहे की जागतिक स्तरावर अब्जावधी डिजिटल जुळ्या मुलांसाठी माहिती प्रसारित करणारे 20 अब्जाहून अधिक कनेक्टेड सेन्सर असतील. 2020 मध्ये, या ट्रेंडला गती मिळावी आणि समोर यावे.

डिजिटल परिवर्तन अधिक हेतुपुरस्सर होईल.

अनेक वर्षांपासून, डिजिटल परिवर्तन हा एक महत्त्वाचा कल म्हणून उल्लेख केला जात आहे. परंतु तज्ञ म्हणतात की बर्‍याच कंपन्या आणि शीर्ष व्यवस्थापकांना या वाक्यांशाचा अर्थ काय आहे याबद्दल अत्यंत अस्पष्ट समज होती. अनेकांसाठी, डिजिटल ट्रान्सफॉर्मेशन म्हणजे नवीन महसूल प्रवाह निर्माण करण्यासाठी कंपनी गोळा करत असलेला डेटा विकण्याचे मार्ग शोधणे. 2020 पर्यंत, अधिकाधिक कंपन्यांना हे समजत आहे की डिजिटल परिवर्तन म्हणजे त्यांच्या व्यवसायाच्या प्रत्येक पैलूमध्ये डेटाचा योग्य वापर करून स्पर्धात्मक फायदा निर्माण करणे. याचा अर्थ आम्ही अपेक्षा करू शकतो की डेटाच्या योग्य आणि माहितीपूर्ण वापराशी संबंधित प्रकल्पांसाठी कंपन्या बजेट वाढवतील.
"आम्ही हळूहळू अशा युगात जात आहोत जिथे बिग डेटा हा प्रारंभिक बिंदू आहे, शेवट नाही."
पर्ल झू ,
डिजिटल मास्टर पुस्तक मालिकेचे लेखक

सारांश

मोठा डेटा हे जावा डेव्हलपर्ससाठी भरपूर संधींसह क्रियाकलापांचे आणखी एक मोठे क्षेत्र आहे. इंटरनेट ऑफ थिंग्ज व्यतिरिक्त, हे क्षेत्र तेजीत आहे आणि प्रोग्रामर आणि इतर तांत्रिक तज्ञांची तीव्र कमतरता आहे. तर आता हे लांबलचक लेख वाचणे थांबवण्याची आणि जावा शिकण्याची वेळ आली आहे!
टिप्पण्या
TO VIEW ALL COMMENTS OR TO MAKE A COMMENT,
GO TO FULL VERSION