CodeGym /Blog Java /Aleatoriu /Java și Big Data: de ce proiectele Big Data nu se pot lip...
John Squirrels
Nivel
San Francisco

Java și Big Data: de ce proiectele Big Data nu se pot lipsi de Java

Publicat în grup
În articolele noastre despre CodeGym, nu ne obosim să menționăm că Java, care are acum 25 de ani, se bucură de o popularitate reînnoită și are perspective strălucitoare în viitorul apropiat. Există mai multe motive pentru aceasta. Una dintre ele este că Java este principalul limbaj de programare în mai multe nișe de piață IT în tendințe, care câștigă rapid popularitate. Java și Big Data: de ce proiectele Big Data nu se pot lipsi de Java - 1 Internetul lucrurilor (IoT) și big data, precum și business intelligence (BI) și analizele în timp real sunt menționate cel mai des în contextul afecțiunii profunde și al sentimentelor tandre pentru Java. Recent, am explorat relația dintre Java și Internetul lucrurilorși a vorbit despre modul în care un dezvoltator Java își poate adapta abilitățile la această nișă. Acum ne îndreptăm atenția către o altă zonă super trendy care – ați ghicit – iubește și Java și nu poate trăi fără el. Așadar, astăzi vom explora următoarele întrebări în legătură cu big data: de ce este Java și, prin urmare, codificatorii Java loiali, de asemenea, super populari în această nișă? cum exact este folosit Java în proiectele de date mari? ce ar trebui să înveți pentru a fi calificat pentru angajare în această nișă? și care sunt tendințele actuale în domeniul big data? Și între toate acestea, ne vom uita la opiniile experților de top din lume în big data, ceea ce l-ar face chiar și pe Homer Simpson să dorească să lucreze cu big data. Java și Big Data: de ce proiectele Big Data nu se pot lipsi de Java - 2

https://ru.wikipedia.org/wiki/Homer_Goes_to_College

„Tot spun că meseria sexy din următorii zece ani va fi cea de statisticieni. Oamenii cred că glumesc, dar cine ar fi ghicit că inginerii informatici ar fi fost meseria sexy a anilor ’90?”

Big data cucerește planeta

Dar mai întâi, puțin despre big data și de ce această nișă este atât de promițătoare pentru construirea unei cariere. Pe scurt, big data își face loc inexorabil, constant și (cel mai important) foarte rapid în procesele de afaceri ale companiilor din întreaga lume. Aceste companii, la rândul lor, sunt forțate să găsească profesioniști în știința datelor (nu doar programatori, desigur), ademenindu-i cu salarii mari și alte avantaje. Potrivit Forbes, utilizarea datelor mari în afaceri a crescutde la 17% în 2015 la 59% în 2018. Big data se răspândește rapid în diverse sectoare ale economiei, inclusiv vânzări, marketing, cercetare și dezvoltare, logistică și absolut orice altceva. Potrivit cercetării IBM, numărul de locuri de muncă pentru profesioniști în acest domeniu va depăși 2,7 milioane până în 2020 doar în Statele Unite. Promițător? Pariezi.

Big data și Java

Acum, de ce big data și Java au atât de multe în comun? Chestia este că multe dintre instrumentele principale pentru big data sunt scrise în Java. În plus, aproape toate aceste instrumente sunt proiecte open source. Aceasta înseamnă că sunt disponibile pentru toată lumea și, în consecință, sunt utilizate în mod activ de către cele mai mari companii IT din întreaga lume. „În mare măsură Big Data este Java. Hadoop și un procent mare din ecosistemul Hadoop sunt scrise în Java. Interfața nativă MapReduce pentru Hadoop este Java. Așa că puteți trece cu ușurință în Big Data, pur și simplu prin construirea de soluții Java care rulează deasupra de Hadoop. Există, de asemenea, biblioteci Java, cum ar fi Cascading, care fac treaba mai ușoară. Java este, de asemenea, foarte util pentru depanarea lucrurilor, chiar dacă utilizați ceva precum Hive." a spusMarcin Mejran, cercetător al datelor și vicepreședinte al dezvoltării datelor la Eight. „Dincolo de Hadoop, Storm este scris în Java și Spark (adică: probabil viitorul hadoop computing) este în Scala (care rulează pe JVM și Spark are o interfață Java). Deci Java acoperă un procent masiv din spațiul Big Data, ", adaugă expertul. După cum puteți vedea, cunoștințele despre Java vor fi pur și simplu de neînlocuit în Big Data, Internetul lucrurilor, învățarea automată și alte câteva nișe care continuă să câștige popularitate.
„Fiecare companie are date mari în viitor și fiecare companie va fi în cele din urmă în domeniul datelor.”
Thomas H. Davenport ,
un academic american și expert în analiză și inovare a proceselor de afaceri
Și acum puțin mai multe despre instrumentele de date mari menționate mai sus, care sunt utilizate pe scară largă de dezvoltatorii Java.

Apache Hadoop

Apache Hadoop este una dintre tehnologiile fundamentale pentru big data și este scrisă în Java. Hadoop este o suită gratuită, open source de utilitare, biblioteci și cadre gestionate de Apache Software Foundation. Creat inițial pentru calcul scalabil, distribuit și tolerant la erori, precum și pentru stocarea unor cantități uriașe de informații diverse, Hadoop devine în mod natural piesa centrală a infrastructurii de date mari pentru multe companii. Companiile din întreaga lume caută în mod activ experți Hadoop, iar Java este o abilitate cheie necesară pentru a stăpâni această tehnologie. Potrivit dezvoltatorilor de pe Slashdot, în 2019, multe companii mari, inclusiv JPMorgan Chase, cu salariile record pentru programatori, au căutat activ experți Hadoop la conferința Hadoop World, dar nici acolo nu au putut găsi destui experți cu abilitățile necesare (în special, cunoștințe a modelului și cadrul de programare Hadoop MapReduce). Asta înseamnă că salariile în acest domeniu vor crește și mai mult. Și sunt deja foarte mari. În special, Business Insider estimează că expertul mediu Hadoop costă 103.000 USD pe an, în timp ce costul mediu al specialiștilor în big data este de 106.000 USD pe an. Recrutorii care caută experți Hadoop evidențiază Java drept una dintre cele mai importante abilități pentru angajare de succes. Hadoop a fost folosit de mult timp sau a fost introdus relativ recent de multe corporații mari, inclusiv IBM, Microsoft și Oracle. În acest moment,
„Unde există fum de date, există foc de afaceri”.

Apache Spark

Apache Spark este o altă platformă importantă de date mari care este un concurent serios al Hadoop. Datorită vitezei, flexibilității și confortului pe care le oferă dezvoltatorilor, Apache Spark devine mediul de lider pentru dezvoltarea la scară largă în SQL, date cu comutare de pachete și transmise în flux și învățarea automată. Ca un cadru pentru procesarea distribuită a datelor mari, Apache Spark funcționează foarte mult ca cadrul Hadoop MapReduce și îi fură treptat MapReduce de primatul în big data. Spark poate fi folosit în multe moduri diferite. Are un API pentru Java, precum și alte câteva limbaje de programare, cum ar fi Scala, Python și R. Astăzi, Spark este utilizat pe scară largă de bănci, companii de telecomunicații, dezvoltatori de jocuri video și chiar guverne. Desigur, giganții IT precum Apple, Facebook, IBM și Microsoft iubesc Apache Spark.

Apache Mahout

Apache Mahout este o bibliotecă de învățare automată Java open source de la Apache. Este un instrument scalabil de învățare automată care poate procesa date pe una sau mai multe mașini. Implementările de învățare automată sunt scrise în Java, iar unele părți sunt construite pe Apache Hadoop.

Apache Storm

Apache Storm este un cadru pentru procesarea fluxurilor distribuite în timp real. Storm simplifică procesarea cu toleranță la erori a fluxurilor de date nelimitate, făcând în timp real ceea ce face Hadoop pentru pachetele de date. Storm se integrează cu orice sistem de așteptare și orice sistem de baze de date.

Java JFreeChart

Java JFreeChart este o bibliotecă open source dezvoltată în Java și concepută pentru a fi utilizată în aplicații bazate pe Java pentru a crea o mare varietate de diagrame. Faptul este că vizualizarea datelor este destul de importantă pentru analiza cu succes a datelor mari. Deoarece big data implică lucrul cu cantități mari de date, poate fi dificil să identifici tendințele sau chiar să ajungi la anumite concluzii analizând datele brute. Dar, dacă aceleași date sunt afișate într-o diagramă, devine mai ușor de înțeles. Este mai ușor să găsești modele și să identifici corelații. După cum se întâmplă, Java JFreeChart ajută la crearea de grafice și diagrame pentru analiza datelor mari.

Deeplearning4j

Deeplearning4j este o bibliotecă Java folosită pentru a construi diferite tipuri de rețele neuronale. Deeplearning4j este implementat în Java și rulează în JVM. De asemenea, este compatibil cu Clojure și include un API pentru limbajul Scala. Deeplearning4j include o implementare a unei mașini Boltzmann restricționate, a unei rețele de credință profundă, a unui autoencoder profund, a unui autoencoder cu stivuire a zgomotului, a unei rețele recursive de tensor neural, word2vec, doc2vec și GloVe.
„Datele devin noua materie primă pentru afaceri”.

Big Data în pragul anului 2020: cele mai noi tendințe

2020 ar trebui să fie un alt an de creștere și evoluție rapidă pentru datele mari, împreună cu adoptarea pe scară largă a datelor mari de către companii și organizații din diverse domenii. Deci, să evidențiem pe scurt tendințele în domeniul big data care ar trebui să joace un rol important anul viitor. Java și Big Data: de ce proiectele Big Data nu se pot lipsi de Java - 3

https://www.arnnet.com.au/slideshow/553034/pictures-our-10-favourite-techie-simpsons-episodes-moments/

Internetul lucrurilor — Big Data devine din ce în ce mai mare

Internetul lucrurilor (IoT) poate părea în afara subiectului, dar nu este cazul. IoT continuă să fie „în tendință” pe măsură ce câștigă avânt și se răspândește în întreaga lume. În consecință, crește și numărul de dispozitive „inteligente” instalate în case și birouri. Așa cum ar trebui, aceste dispozitive trimit tot felul de date acolo unde trebuie. Aceasta înseamnă că volumul de date mari va crește doar. Potrivit experților, multe organizații au deja o mulțime de date, în primul rând din IoT, pe care nu sunt bine pregătite să le folosească. În 2020, această avalanșă de date va deveni și mai mare. În consecință, și investițiile în proiecte de date mari vor crește rapid. Și amintiți-vă, IoT este, de asemenea, foarte pasionat de Java . Cui nu-i place?

Gemeni digitali

Gemenii digitali sunt o altă tendință interesantă care este direct legată de Internetul lucrurilor și big data. În consecință, Java va vedea destul de multă utilizare aici. Ce este un geamăn digital? Aceasta este o replică digitală a unui obiect sau sistem real. Un analog digital al unui dispozitiv fizic face posibilă simularea proceselor interne ale unui obiect real, a caracteristicilor tehnice și a comportamentului sub influența interferenței și a mediului său. Un geamăn digital nu poate funcționa fără un număr mare de senzori în dispozitivul real care funcționează în paralel. Până în 2020, se așteaptă ca la nivel global să existe peste 20 de miliarde de senzori conectați care transmit informații pentru miliarde de gemeni digitali. În 2020, această tendință ar trebui să capete amploare și să iasă în prim-plan.

Transformarea digitală va deveni mai intenționată.

De câțiva ani, transformarea digitală este menționată ca o tendință importantă. Dar experții spun că multe companii și manageri de top aveau o înțelegere extrem de vagă a ceea ce înseamnă expresia. Pentru mulți, transformarea digitală a însemnat găsirea unor modalități de a vinde datele pe care compania le colectează pentru a genera noi fluxuri de venituri. Până în 2020, tot mai multe companii realizează că transformarea digitală înseamnă crearea unui avantaj competitiv prin utilizarea adecvată a datelor în fiecare aspect al afacerii lor. Aceasta înseamnă că ne putem aștepta ca companiile să mărească bugetele pentru proiecte legate de utilizarea corectă și informată a datelor.
„Ne îndreptăm încet într-o eră în care Big Data este punctul de plecare, nu sfârșitul.”
Pearl Zhu ,
autoarea seriei de cărți Digital Master

rezumat

Big data este un alt domeniu de activitate cu adevărat enorm, cu o mulțime de oportunități pentru dezvoltatorii Java. Pe lângă Internetul lucrurilor, această zonă este în plină expansiune și suferă de o lipsă acută de programatori și alți experți tehnici. Așa că acum este timpul să nu mai citiți aceste articole lungi și să începeți să învățați Java!
Comentarii
TO VIEW ALL COMMENTS OR TO MAKE A COMMENT,
GO TO FULL VERSION