CodeGym /Java Blog /अनियमित /जावा और बिग डेटा: बिग डेटा प्रोजेक्ट जावा के बिना क्यों न...
John Squirrels
स्तर 41
San Francisco

जावा और बिग डेटा: बिग डेटा प्रोजेक्ट जावा के बिना क्यों नहीं चल सकते

अनियमित ग्रुप में प्रकाशित
CodeGym पर हमारे लेखों में, हम यह उल्लेख करते नहीं थकते कि जावा, जो अब 25 साल पुराना है, नए सिरे से लोकप्रियता का आनंद ले रहा है और निकट भविष्य में शानदार संभावनाएं हैं। इसके अनेक कारण हैं। उनमें से एक यह है कि जावा कई ट्रेंडिंग आईटी मार्केट में मुख्य प्रोग्रामिंग लैंग्वेज है जो तेजी से लोकप्रियता हासिल कर रही है। जावा और बिग डेटा: बिग डेटा प्रोजेक्ट जावा के बिना क्यों नहीं चल सकते - 1 इंटरनेट ऑफ थिंग्स (IoT) और बिग डेटा, साथ ही बिजनेस इंटेलिजेंस (BI), और रियल-टाइम एनालिटिक्स का उल्लेख अक्सर जावा के लिए गहरे स्नेह और कोमल भावनाओं के संदर्भ में किया जाता है। हाल ही में, हमने जावा और इंटरनेट ऑफ थिंग्स के बीच संबंध की खोज कीऔर इस बारे में बात की कि कैसे एक जावा डेवलपर अपने कौशल को इस क्षेत्र में ढाल सकता है। अब हम अपना ध्यान एक और सुपर ट्रेंडिंग क्षेत्र की ओर लगाते हैं - आपने अनुमान लगाया - जावा को भी प्यार करता है और इसके बिना नहीं रह सकता। तो, आज हम बड़े डेटा के संबंध में निम्नलिखित प्रश्नों का पता लगाएंगे: जावा क्यों है, और इसलिए वफादार जावा कोडर भी इस जगह में बहुत लोकप्रिय हैं? बड़ी डेटा परियोजनाओं में जावा का उपयोग कैसे किया जाता है? इस क्षेत्र में रोजगार के योग्य होने के लिए आपको क्या सीखना चाहिए? और बड़े डेटा में मौजूदा रुझान क्या हैं? और इन सबके बीच, हम बड़े डेटा पर दुनिया के शीर्ष विशेषज्ञों की राय देखेंगे, जिससे होमर सिम्पसन भी बड़े डेटा के साथ काम करना चाहेंगे। जावा और बिग डेटा: बिग डेटा प्रोजेक्ट जावा के बिना क्यों नहीं चल सकते - 2

https://ru.wikipedia.org/wiki/Homer_Goes_to_College

"मैं कहता रहता हूं कि अगले दस वर्षों में सेक्सी नौकरी सांख्यिकीविद् होगी। लोगों को लगता है कि मैं मजाक कर रहा हूं, लेकिन किसने अनुमान लगाया होगा कि कंप्यूटर इंजीनियर 1990 के दशक की सेक्सी नौकरी रहे होंगे?"

बड़ा डेटा ग्रह को जीत रहा है

लेकिन पहले, बड़े डेटा के बारे में थोड़ा सा और यह आला करियर बनाने के लिए इतना आशाजनक क्यों है। संक्षेप में, बड़ा डेटा दुनिया भर की कंपनियों की व्यावसायिक प्रक्रियाओं में बहुत तेज़ी से, लगातार और (सबसे महत्वपूर्ण) बहुत तेज़ी से अपना रास्ता बना रहा है। बदले में, उन कंपनियों को डेटा विज्ञान पेशेवरों (न केवल प्रोग्रामर, निश्चित रूप से) को खोजने के लिए मजबूर किया जा रहा है, उन्हें उच्च वेतन और अन्य भत्तों का लालच दिया जा रहा है। फोर्ब्स के मुताबिक, बिजनेस में बिग डेटा का इस्तेमाल बढ़ा है2015 में 17% से 2018 में 59%। बिग डेटा तेजी से अर्थव्यवस्था के विभिन्न क्षेत्रों में फैल रहा है, जिसमें बिक्री, विपणन, अनुसंधान और विकास, रसद और बिल्कुल सब कुछ शामिल है। आईबीएम के शोध के अनुसार, अकेले संयुक्त राज्य अमेरिका में 2020 तक इस क्षेत्र में पेशेवरों के लिए नौकरियों की संख्या 2.7 मिलियन से अधिक हो जाएगी। होनहार? बिलकुल।

बड़ा डेटा और जावा

तो फिर, बड़े डेटा और जावा में इतना समानता क्यों है? बात यह है कि बड़े डेटा के कई मुख्य उपकरण जावा में लिखे गए हैं। क्या अधिक है, इनमें से लगभग सभी उपकरण ओपन सोर्स प्रोजेक्ट हैं। इसका मतलब है कि वे सभी के लिए उपलब्ध हैं और तदनुसार दुनिया भर की सबसे बड़ी आईटी कंपनियों द्वारा सक्रिय रूप से उपयोग किया जाता है। "काफी हद तक बिग डेटा जावा है। Hadoop और Hadoop पारिस्थितिकी तंत्र का एक बड़ा प्रतिशत जावा में लिखा गया है। Hadoop के लिए मूल MapReduce इंटरफ़ेस Java है। इसलिए आप शीर्ष पर चलने वाले Java समाधानों का निर्माण करके आसानी से बड़े डेटा में जा सकते हैं। Hadoop की। कैस्केडिंग जैसी जावा लाइब्रेरी भी हैं जो काम को आसान बनाती हैं। जावा चीजों को डिबग करने के लिए भी वास्तव में उपयोगी है, भले ही आप हाइव जैसी किसी चीज का उपयोग करते हों। कहाMarcin Mejran, एक डेटा वैज्ञानिक और आठ में डेटा विकास के उपाध्यक्ष। "हडूप से परे, स्टॉर्म जावा और स्पार्क में लिखा गया है (यानी: यकीनन हडूप कंप्यूटिंग का भविष्य) स्काला में है (जो जेवीएम पर चलता है और स्पार्क में जावा इंटरफ़ेस है)। इसलिए जावा बिग डेटा स्पेस का एक बड़ा प्रतिशत कवर करता है, "विशेषज्ञ कहते हैं। जैसा कि आप देख सकते हैं, जावा का ज्ञान बड़े डेटा, इंटरनेट ऑफ थिंग्स, मशीन लर्निंग, और कई अन्य क्षेत्रों में बस अपूरणीय होगा जो लोकप्रियता हासिल करना जारी रखते हैं।
"हर कंपनी के भविष्य में बड़ा डेटा होता है और हर कंपनी अंततः डेटा व्यवसाय में होगी।"
थॉमस एच. डेवनपोर्ट ,
एक अमेरिकी अकादमिक और एनालिटिक्स और बिजनेस प्रोसेस इनोवेशन के विशेषज्ञ
और अब उपरोक्त बड़े डेटा टूल के बारे में थोड़ा और अधिक, जो जावा डेवलपर्स द्वारा व्यापक रूप से उपयोग किया जाता है।

अपाचे हडूप

Apache Hadoop बड़े डेटा के लिए मूलभूत तकनीकों में से एक है, और इसे Java में लिखा गया है। Hadoop Apache Software Foundation द्वारा प्रबंधित उपयोगिताओं, पुस्तकालयों और रूपरेखाओं का एक मुफ़्त, खुला स्रोत सूट है। मूल रूप से स्केलेबल, वितरित, और दोष-सहिष्णु कंप्यूटिंग के लिए बनाया गया, साथ ही बड़ी मात्रा में विभिन्न सूचनाओं को संग्रहीत करने के लिए, Hadoop स्वाभाविक रूप से कई कंपनियों के लिए बड़े डेटा इन्फ्रास्ट्रक्चर का केंद्रबिंदु बन रहा है। दुनिया भर की कंपनियां सक्रिय रूप से हडूप विशेषज्ञों की तलाश कर रही हैं, और इस तकनीक में महारत हासिल करने के लिए जावा एक महत्वपूर्ण कौशल है। स्लैशडॉट पर डेवलपर्स के अनुसार, 2019 में, जेपी मॉर्गन चेस सहित कई बड़ी कंपनियों ने, प्रोग्रामर्स के लिए अपने रिकॉर्ड-ब्रेकिंग वेतन के साथ, Hadoop वर्ल्ड कॉन्फ्रेंस में सक्रिय रूप से Hadoop विशेषज्ञों की मांग की, लेकिन वहां भी, उन्हें आवश्यक कौशल (विशेष रूप से, ज्ञान) के साथ पर्याप्त विशेषज्ञ नहीं मिले। Hadoop MapReduce प्रोग्रामिंग मॉडल और फ्रेमवर्क का)। इसका मतलब है कि इस फील्ड में सैलरी और भी ज्यादा बढ़ेगी। और वे पहले से ही बहुत बड़े हैं। विशेष रूप से, बिजनेस इनसाइडर का अनुमान है कि हडूप विशेषज्ञ की औसत लागत $103,000 प्रति वर्ष है, जबकि बड़े डेटा विशेषज्ञों की औसत लागत $106,000 प्रति वर्ष है। हडूप विशेषज्ञों की तलाश करने वाले भर्तीकर्ता सफल रोजगार के लिए जावा को सबसे महत्वपूर्ण कौशल में से एक के रूप में उजागर करते हैं। Hadoop का लंबे समय से उपयोग किया जा रहा है या IBM, Microsoft और Oracle सहित कई बड़े निगमों द्वारा अपेक्षाकृत हाल ही में पेश किया गया है। इस समय,
"जहां डेटा धुंआ है, वहां व्यापार में आग है।"
डॉ. थॉमस रेडमैन ,
डेटा एनालिटिक्स और डिजिटल टेक्नोलॉजी के जाने-माने विशेषज्ञ

अपाचे स्पार्क

Apache Spark एक अन्य महत्वपूर्ण बड़ा डेटा प्लेटफ़ॉर्म है जो Hadoop का एक गंभीर प्रतियोगी है। डेवलपर्स द्वारा प्रदान की जाने वाली गति, लचीलेपन और सुविधा के कारण, Apache Spark SQL, पैकेट-स्विच्ड और स्ट्रीम किए गए डेटा और मशीन लर्निंग में बड़े पैमाने पर विकास के लिए अग्रणी वातावरण बन रहा है। वितरित बड़े डेटा प्रोसेसिंग के लिए एक ढांचे के रूप में, Apache Spark, Hadoop MapReduce ढांचे की तरह बहुत काम करता है और धीरे-धीरे बड़े डेटा में MapReduce की प्रधानता को लूट रहा है। स्पार्क को कई तरह से इस्तेमाल किया जा सकता है। इसमें जावा के लिए एक एपीआई है, साथ ही कई अन्य प्रोग्रामिंग भाषाएं, जैसे कि स्काला, पायथन और आर। आज, स्पार्क व्यापक रूप से बैंकों, दूरसंचार कंपनियों, वीडियो गेम डेवलपर्स और यहां तक ​​कि सरकारों द्वारा उपयोग किया जाता है। स्वाभाविक रूप से, Apple, Facebook, IBM और Microsoft जैसे IT दिग्गज Apache Spark से प्यार करते हैं।

अपाचे महौत

Apache Mahout, Apache की एक ओपन सोर्स जावा मशीन लर्निंग लाइब्रेरी है। यह एक स्केलेबल मशीन लर्निंग टूल है जो एक या अधिक मशीनों पर डेटा को प्रोसेस कर सकता है। मशीन सीखने का कार्यान्वयन जावा में लिखा गया है, और कुछ भाग Apache Hadoop पर बनाए गए हैं।

अपाचे तूफान

अपाचे स्टॉर्म वास्तविक समय में वितरित स्ट्रीम प्रोसेसिंग के लिए एक रूपरेखा है। स्टॉर्म असीमित डेटा धाराओं के दोष-सहिष्णु प्रसंस्करण को सरल करता है, वास्तविक समय में वही करता है जो डेटा पैकेट के लिए Hadoop करता है। स्टॉर्म किसी भी क्यूइंग सिस्टम और किसी भी डेटाबेस सिस्टम के साथ एकीकृत होता है।

जावा जेफ्री चार्ट

Java JFreeChart जावा में विकसित एक ओपन सोर्स लाइब्रेरी है और इसे विभिन्न प्रकार के चार्ट बनाने के लिए जावा-आधारित अनुप्रयोगों में उपयोग के लिए डिज़ाइन किया गया है। तथ्य यह है कि बड़े डेटा का सफलतापूर्वक विश्लेषण करने के लिए डेटा विज़ुअलाइज़ेशन काफी महत्वपूर्ण है। क्योंकि बड़े डेटा में बड़ी मात्रा में डेटा के साथ काम करना शामिल है, कच्चे डेटा को देखकर रुझानों की पहचान करना या विशेष निष्कर्ष पर पहुंचना मुश्किल हो सकता है। लेकिन, यदि उसी डेटा को चार्ट में प्रदर्शित किया जाता है, तो यह अधिक समझ में आता है। पैटर्न खोजना और सहसंबंधों की पहचान करना आसान है। जैसा कि होता है, Java JFreeChart बड़े डेटा विश्लेषण के लिए ग्राफ़ और चार्ट बनाने में मदद करता है।

डीप लर्निंग4जे

Deeplearning4j एक जावा लाइब्रेरी है जिसका उपयोग विभिन्न प्रकार के तंत्रिका नेटवर्क बनाने के लिए किया जाता है। Deeplearning4j जावा में लागू किया गया है और JVM में चलता है। यह क्लोजर के साथ भी संगत है और इसमें स्काला भाषा के लिए एपीआई शामिल है। Deeplearning4j में प्रतिबंधित Boltzmann मशीन, डीप बिलीफ नेटवर्क, डीप ऑटोएन्कोडर, स्टैक्ड डीनोइजिंग ऑटोएन्कोडर, रिकर्सिव न्यूरल टेंसर नेटवर्क, Word2vec, doc2vec और GloVe का कार्यान्वयन शामिल है।
"डेटा व्यवसाय के लिए नया कच्चा माल बन रहा है।"

2020 की दहलीज पर बड़ा डेटा: सबसे ताज़ा रुझान

विभिन्न क्षेत्रों में कंपनियों और संगठनों द्वारा बड़े डेटा को व्यापक रूप से अपनाने के साथ-साथ 2020 बड़े डेटा के लिए तेजी से विकास और विकास का एक और वर्ष होना चाहिए। तो, आइए बड़े डेटा के रुझानों पर संक्षेप में प्रकाश डालते हैं जो अगले साल एक महत्वपूर्ण भूमिका निभाएंगे। जावा और बिग डेटा: बिग डेटा प्रोजेक्ट जावा के बिना क्यों नहीं चल सकते - 3

https://www.arnnet.com.au/slideshow/553034/pictures-our-10-favourite-techie-simpsons-episodes-moments/

इंटरनेट ऑफ थिंग्स - बड़ा डेटा बड़ा हो रहा है

इंटरनेट ऑफ थिंग्स (IoT) ऑफ-टॉपिक जैसा लग सकता है, लेकिन ऐसा नहीं है। जैसे ही यह गति प्राप्त करता है और दुनिया भर में फैलता है, IoT "प्रवृत्ति" जारी रखता है। नतीजतन, घरों और कार्यालयों में स्थापित "स्मार्ट" उपकरणों की संख्या भी बढ़ रही है। जैसा कि उन्हें करना चाहिए, ये डिवाइस सभी प्रकार के डेटा भेज रहे हैं जहां उन्हें जाने की जरूरत है। इसका मतलब है कि बिग डेटा की मात्रा केवल बढ़ेगी। विशेषज्ञों के अनुसार, कई संगठनों के पास पहले से ही बहुत सारा डेटा है, मुख्य रूप से IoT से, जिसका उपयोग करने के लिए वे अच्छी तरह से तैयार नहीं हैं। 2020 में डेटा का यह हिमस्खलन और भी बड़ा हो जाएगा। नतीजतन, बड़ी डेटा परियोजनाओं में निवेश भी तेजी से बढ़ेगा। और याद रखें, IoT भी Java को बहुत पसंद करता है । इसे कौन प्यार नहीं करता?

डिजिटल जुड़वाँ

डिजिटल जुड़वाँ एक और दिलचस्प आने वाली प्रवृत्ति है जो सीधे इंटरनेट ऑफ़ थिंग्स और बड़े डेटा से संबंधित है। तदनुसार, जावा यहां काफी उपयोग करेगा। डिजिटल ट्विन क्या है? यह एक वास्तविक वस्तु या प्रणाली की एक डिजिटल प्रतिकृति है। एक भौतिक उपकरण का एक डिजिटल एनालॉग हस्तक्षेप और उसके वातावरण के प्रभाव में वास्तविक वस्तु की आंतरिक प्रक्रियाओं, तकनीकी विशेषताओं और व्यवहार को अनुकरण करना संभव बनाता है। समानांतर में काम करने वाले वास्तविक डिवाइस में बड़ी संख्या में सेंसर के बिना एक डिजिटल ट्विन काम नहीं कर सकता है। 2020 तक, यह उम्मीद की जाती है कि विश्व स्तर पर 20 बिलियन से अधिक कनेक्टेड सेंसर होंगे जो अरबों डिजिटल जुड़वाँ के लिए सूचना प्रसारित करेंगे। 2020 में, इस प्रवृत्ति को गति मिलनी चाहिए और सामने आनी चाहिए।

डिजिटल परिवर्तन अधिक इरादतन हो जाएगा।

कई वर्षों से, डिजिटल परिवर्तन को एक महत्वपूर्ण प्रवृत्ति के रूप में वर्णित किया गया है। लेकिन विशेषज्ञों का कहना है कि कई कंपनियों और शीर्ष प्रबंधकों को इस बात की बेहद अस्पष्ट समझ थी कि इस वाक्यांश का क्या अर्थ है। कई लोगों के लिए, डिजिटल ट्रांसफ़ॉर्मेशन का मतलब था नए रेवेन्यू स्ट्रीम उत्पन्न करने के लिए कंपनी द्वारा एकत्र किए गए डेटा को बेचने के तरीके खोजना। 2020 तक, अधिक से अधिक कंपनियां यह महसूस कर रही हैं कि डिजिटल परिवर्तन उनके व्यवसाय के हर पहलू में डेटा का सही उपयोग करके प्रतिस्पर्धात्मक लाभ पैदा करने के बारे में है। इसका मतलब है कि हम उम्मीद कर सकते हैं कि कंपनियां डेटा के सही और सूचित उपयोग से संबंधित परियोजनाओं के बजट में वृद्धि करेंगी।
"हम धीरे-धीरे एक ऐसे युग में जा रहे हैं जहां बिग डेटा शुरुआती बिंदु है, अंत नहीं।"

डिजिटल मास्टर पुस्तक श्रृंखला के लेखक पर्ल झू

सारांश

जावा डेवलपर्स के लिए बहुत सारे अवसरों के साथ बिग डेटा गतिविधि का एक और वास्तव में विशाल क्षेत्र है। इंटरनेट ऑफ थिंग्स के अलावा, यह क्षेत्र फलफूल रहा है और प्रोग्रामरों और अन्य तकनीकी विशेषज्ञों की भारी कमी से ग्रस्त है। तो अब इन लंबे लेखों को पढ़ना बंद करने और जावा सीखना शुरू करने का समय आ गया है!
टिप्पणियां
TO VIEW ALL COMMENTS OR TO MAKE A COMMENT,
GO TO FULL VERSION