CodeGym /Java Blog /Random-IT /Java e Big Data: perché i progetti Big Data non possono f...
John Squirrels
Livello 41
San Francisco

Java e Big Data: perché i progetti Big Data non possono fare a meno di Java

Pubblicato nel gruppo Random-IT
Nei nostri articoli su CodeGym non ci stanchiamo mai di ricordare che Java, che ha ormai 25 anni, sta godendo di una rinnovata popolarità e ha brillanti prospettive per il prossimo futuro. Ci sono diverse ragioni per questo. Uno di questi è che Java è il principale linguaggio di programmazione in diverse nicchie di mercato IT di tendenza che stanno rapidamente guadagnando popolarità. Java e Big Data: perché i progetti Big Data non possono fare a meno di Java - 1 L'Internet of Things (IoT) e i big data, così come la business intelligence (BI) e l'analisi in tempo reale sono citati più spesso nel contesto di profondo affetto e teneri sentimenti per Java. Di recente, abbiamo esplorato la relazione tra Java e l'Internet delle cosee ha parlato di come uno sviluppatore Java può adattare le proprie capacità a questa nicchia. Ora rivolgiamo la nostra attenzione a un'altra area di super tendenza che - hai indovinato - ama anche Java e non può farne a meno. Quindi, oggi esploreremo le seguenti domande in relazione ai big data: perché Java, e quindi i fedeli programmatori Java, sono molto popolari anche in questa nicchia? come viene utilizzato esattamente Java nei progetti di big data? cosa dovresti imparare per essere qualificato per l'occupazione in questa nicchia? e quali sono le tendenze attuali nei big data? E in mezzo a tutto questo, esamineremo le opinioni dei massimi esperti mondiali di big data, che farebbero venire voglia anche a Homer Simpson di lavorare con i big data. Java e Big Data: perché i progetti Big Data non possono fare a meno di Java - 2

https://ru.wikipedia.org/wiki/Homer_Goes_to_College

"Continuo a dire che il lavoro sexy nei prossimi dieci anni sarà quello degli statistici. La gente pensa che stia scherzando, ma chi avrebbe mai immaginato che gli ingegneri informatici sarebbero stati il ​​lavoro sexy degli anni '90?"

I big data stanno conquistando il pianeta

Ma prima, un po' sui big data e sul perché questa nicchia è così promettente per costruire una carriera. In breve, i big data si stanno inesorabilmente, costantemente e (soprattutto) molto rapidamente facendosi strada nei processi aziendali delle aziende di tutto il mondo. Quelle aziende, a loro volta, sono costrette a trovare professionisti della scienza dei dati (non solo programmatori, ovviamente), attirandoli con alti stipendi e altri vantaggi. Secondo Forbes, l'uso dei big data nelle aziende è aumentatodal 17% nel 2015 al 59% nel 2018. I big data si stanno rapidamente diffondendo in vari settori dell'economia, tra cui vendite, marketing, ricerca e sviluppo, logistica e assolutamente tutto il resto. Secondo una ricerca di IBM, il numero di posti di lavoro per professionisti in questo campo supererà i 2,7 milioni entro il 2020 solo negli Stati Uniti. Promettente? Scommetti.

Big data e Java

Allora, perché i big data e Java hanno così tanto in comune? Il fatto è che molti dei principali strumenti per i big data sono scritti in Java. Inoltre, quasi tutti questi strumenti sono progetti open source. Ciò significa che sono disponibili per tutti e di conseguenza vengono utilizzati attivamente dalle più grandi aziende IT di tutto il mondo. "In larga misura i Big Data sono Java. Hadoop e un'ampia percentuale dell'ecosistema Hadoop sono scritti in Java. L'interfaccia MapReduce nativa per Hadoop è Java. Quindi puoi spostarti facilmente nei Big Data semplicemente costruendo soluzioni Java che girano sulla parte superiore di Hadoop. Ci sono anche librerie Java come Cascading che semplificano il lavoro. Java è anche molto utile per il debug di cose anche se usi qualcosa come Hive." disseMarcin Mejran, data scientist e vicepresidente dello sviluppo dei dati presso Eight. "Al di là di Hadoop, Storm è scritto in Java e Spark (vale a dire: probabilmente il futuro dell'hadoop computing) è in Scala (che gira su JVM e Spark ha un'interfaccia Java). Quindi Java copre un'enorme percentuale dello spazio dei Big Data, " aggiunge l'esperto. Come puoi vedere, la conoscenza di Java sarà semplicemente insostituibile nei big data, nell'Internet delle cose, nell'apprendimento automatico e in molte altre nicchie che continuano a guadagnare popolarità.
"Ogni azienda ha i big data nel suo futuro e ogni azienda alla fine sarà nel business dei dati".
Thomas H. Davenport ,
accademico americano ed esperto di analisi e innovazione dei processi aziendali
E ora qualcosa in più sui suddetti strumenti per big data, ampiamente utilizzati dagli sviluppatori Java.

ApacheHadoop

Apache Hadoop è una delle tecnologie fondamentali per i big data ed è scritto in Java. Hadoop è una suite open source gratuita di utilità, librerie e framework gestita da Apache Software Foundation. Originariamente creato per l'elaborazione scalabile, distribuita e tollerante ai guasti, nonché per l'archiviazione di enormi quantità di varie informazioni, Hadoop sta naturalmente diventando il fulcro dell'infrastruttura di big data per molte aziende. Le aziende di tutto il mondo sono attivamente alla ricerca di esperti Hadoop e Java è una competenza chiave richiesta per padroneggiare questa tecnologia. Secondo gli sviluppatori su Slashdot, nel 2019, molte grandi aziende, tra cui JPMorgan Chase, con i suoi stipendi da record per i programmatori, hanno cercato attivamente esperti Hadoop alla conferenza Hadoop World, ma anche lì non sono riusciti a trovare abbastanza esperti con le competenze necessarie (in particolare, conoscenza del modello e del framework di programmazione Hadoop MapReduce). Ciò significa che gli stipendi in questo campo cresceranno ancora di più. E sono già molto grandi. In particolare, Business Insider stima che l'esperto medio di Hadoop costi $ 103.000 all'anno, mentre il costo medio degli specialisti di big data è di $ 106.000 all'anno. I reclutatori alla ricerca di esperti Hadoop evidenziano Java come una delle competenze più importanti per un impiego di successo. Hadoop è stato a lungo utilizzato o è stato introdotto relativamente di recente da molte grandi aziende, tra cui IBM, Microsoft e Oracle. Al momento,
"Dove c'è il fumo dei dati, c'è il fuoco degli affari".

Scintilla Apache

Apache Spark è un'altra importante piattaforma di big data che è un serio concorrente di Hadoop. Grazie alla velocità, flessibilità e praticità che offre agli sviluppatori, Apache Spark sta diventando l'ambiente leader per lo sviluppo su larga scala in SQL, dati a commutazione di pacchetto e in streaming e machine learning. Come framework per l'elaborazione distribuita di big data, Apache Spark funziona in modo molto simile al framework Hadoop MapReduce e sta gradualmente derubando MapReduce del suo primato nei big data. Spark può essere utilizzato in molti modi diversi. Ha un'API per Java, oltre a molti altri linguaggi di programmazione, come Scala, Python e R. Oggi Spark è ampiamente utilizzato da banche, società di telecomunicazioni, sviluppatori di videogiochi e persino governi. Naturalmente, i giganti dell'IT come Apple, Facebook, IBM e Microsoft adorano Apache Spark.

Apache Mahout

Apache Mahout è una libreria di apprendimento automatico Java open source di Apache. È uno strumento di apprendimento automatico scalabile in grado di elaborare dati su una o più macchine. Le implementazioni di machine learning sono scritte in Java e alcune parti sono costruite su Apache Hadoop.

Tempesta Apache

Apache Storm è un framework per l'elaborazione di flussi distribuiti in tempo reale. Storm semplifica l'elaborazione fault-tolerant di flussi di dati illimitati, facendo in tempo reale ciò che Hadoop fa per i pacchetti di dati. Storm si integra con qualsiasi sistema di accodamento e qualsiasi sistema di database.

Java JFreeChart

Java JFreeChart è una libreria open source sviluppata in Java e progettata per l'utilizzo in applicazioni basate su Java per creare un'ampia varietà di grafici. Il fatto è che la visualizzazione dei dati è molto importante per analizzare con successo i big data. Poiché i big data implicano l'utilizzo di grandi quantità di dati, può essere difficile identificare le tendenze o persino giungere a conclusioni particolari osservando i dati grezzi. Ma se gli stessi dati vengono visualizzati in un grafico, diventa più comprensibile. È più facile trovare schemi e identificare correlazioni. Come accade, Java JFreeChart aiuta a creare grafici e diagrammi per l'analisi dei big data.

Apprendimento profondo4j

Deeplearning4j è una libreria Java utilizzata per costruire vari tipi di reti neurali. Deeplearning4j è implementato in Java e viene eseguito nella JVM. È anche compatibile con Clojure e include un'API per il linguaggio Scala. Deeplearning4j include un'implementazione di una macchina Boltzmann ristretta, una rete di credenze profonde, un codificatore automatico profondo, un codificatore automatico di denoising impilato, una rete tensoriale neurale ricorsiva, word2vec, doc2vec e GloVe.
"I dati stanno diventando la nuova materia prima per il business".

Big Data alle soglie del 2020: i trend più freschi

Il 2020 dovrebbe essere un altro anno di rapida crescita ed evoluzione per i big data, insieme all'adozione diffusa dei big data da parte di aziende e organizzazioni in vari campi. Quindi, evidenziamo brevemente le tendenze nei big data che dovrebbero svolgere un ruolo importante il prossimo anno. Java e Big Data: perché i progetti Big Data non possono fare a meno di Java - 3

https://www.arnnet.com.au/slideshow/553034/pictures-our-10-favourite-techie-simpsons-episodes-moments/

Internet delle cose: i big data stanno diventando più grandi

L'Internet of Things (IoT) può sembrare fuori tema, ma non è così. L'IoT continua a "fare tendenza" mentre guadagna slancio e si diffonde in tutto il mondo. Cresce di conseguenza anche il numero di dispositivi “intelligenti” installati nelle abitazioni e negli uffici. Come dovrebbero, questi dispositivi stanno inviando tutti i tipi di dati dove devono andare. Ciò significa che il volume dei big data non farà che crescere. Secondo gli esperti, molte organizzazioni dispongono già di molti dati, principalmente dall'IoT, che non sono ben preparati a utilizzare. Nel 2020, questa valanga di dati diventerà ancora più grande. Di conseguenza, anche gli investimenti in progetti di big data aumenteranno rapidamente. E ricorda, anche l'IoT è molto affezionato a Java . Chi non lo ama?

Gemelli digitali

I gemelli digitali sono un'altra interessante tendenza in arrivo direttamente correlata all'Internet of Things e ai big data. Di conseguenza, Java vedrà un bel po' di utilizzo qui. Cos'è un gemello digitale? Questa è una replica digitale di un oggetto o sistema reale. Un analogo digitale di un dispositivo fisico consente di simulare i processi interni, le caratteristiche tecniche e il comportamento di un oggetto reale sotto l'influenza dell'interferenza e del suo ambiente. Un gemello digitale non può funzionare senza che un numero enorme di sensori nel dispositivo reale funzionino in parallelo. Entro il 2020, si prevede che a livello globale ci saranno più di 20 miliardi di sensori connessi che trasmettono informazioni per miliardi di gemelli digitali. Nel 2020, questa tendenza dovrebbe acquisire slancio e venire alla ribalta.

La trasformazione digitale diventerà più intenzionale.

Per diversi anni, la trasformazione digitale è stata citata come una tendenza importante. Ma gli esperti affermano che molte aziende e top manager avevano una comprensione estremamente vaga di cosa significasse la frase. Per molti, la trasformazione digitale ha significato trovare modi per vendere i dati raccolti dall'azienda al fine di generare nuovi flussi di entrate. Entro il 2020, sempre più aziende si stanno rendendo conto che la trasformazione digitale consiste nel creare un vantaggio competitivo utilizzando correttamente i dati in ogni aspetto della loro attività. Ciò significa che possiamo aspettarci che le aziende aumentino i budget per i progetti relativi all'uso corretto e consapevole dei dati.
"Ci stiamo muovendo lentamente in un'era in cui i Big Data sono il punto di partenza, non la fine".
Pearl Zhu ,
autrice della serie di libri Digital Master

Riepilogo

I big data sono un'altra area di attività davvero enorme con molte opportunità per gli sviluppatori Java. Oltre all'Internet delle cose, quest'area è in piena espansione e soffre di una grave carenza di programmatori e altri esperti tecnici. Quindi ora è il momento di smettere di leggere questi lunghi articoli e iniziare a imparare Java!
Commenti
TO VIEW ALL COMMENTS OR TO MAKE A COMMENT,
GO TO FULL VERSION