CodeGym /Blog Jawa /Acak /Java lan Big Data: kenapa proyek Big Data ora bisa ditind...
John Squirrels
tingkat
San Francisco

Java lan Big Data: kenapa proyek Big Data ora bisa ditindakake tanpa Java

Diterbitake ing grup
Ing artikel kita ing CodeGym, kita ora bosen nyebutake manawa Jawa, sing saiki umure 25 taun, seneng popularitas anyar lan duwe prospek sing apik ing mangsa ngarep. Ana sawetara alasan kanggo iki. Salah sijine yaiku Java minangka basa pamrograman utama ing sawetara relung pasar IT sing lagi populer kanthi cepet. Java lan Big Data: kenapa proyek Big Data ora bisa ditindakake tanpa Java - 1 Internet of Things (IoT) lan data gedhe, uga intelijen bisnis (BI), lan analitik wektu nyata paling asring kasebut ing konteks tresno sing jero lan perasaan sing lembut kanggo Jawa. Bubar, kita njelajah hubungane Jawa lan Internet of thingslan ngedika bab carane pangembang Jawa bisa Ngatur skills kanggo niche iki. Saiki kita fokusake menyang wilayah super trending liyane sing - sampeyan bisa ngira - uga tresna Jawa lan ora bisa urip tanpa iku. Dadi, dina iki kita bakal njelajah pitakonan ing ngisor iki sing ana hubungane karo data gedhe: kenapa Jawa, lan mulane coders Java sing setya, uga populer banget ing ceruk iki? carane persis Java digunakake ing proyek data amba? apa sing kudu sampeyan sinau supaya bisa entuk lapangan kerja ing ceruk iki? lan apa tren saiki ing data gedhe? Lan ing antarane kabeh iki, kita bakal ndeleng panemu para ahli top ing donya babagan data gedhe, sing bakal nggawe Homer Simpson pengin nggarap data gedhe. Java lan Big Data: kenapa proyek Big Data ora bisa ditindakake tanpa Java - 2

https://ru.wikipedia.org/wiki/Homer_Goes_to_College

"Aku terus ngomong yen proyek seksi ing sepuluh taun sabanjure bakal dadi ahli statistik. Wong mikir aku guyon, nanging sapa sing bakal ngira yen insinyur komputer bakal dadi proyek seksi ing taun 1990-an?"

Data gedhe nelukake planet kasebut

Nanging pisanan, sethithik babagan data gedhe lan ngapa niche iki pancen njanjeni kanggo mbangun karir. Cekakipun, data amba punika inexorably, ajeg, lan (paling penting) banget cepet menyang proses bisnis perusahaan ing saindhenging donya. Perusahaan-perusahaan kasebut, banjur kepeksa golek profesional ilmu data (ora mung programer, mesthine), nggodho kanthi gaji dhuwur lan tunjangan liyane. Miturut Forbes, panggunaan data gedhe ing bisnis tambah akehsaka 17% ing 2015 kanggo 59% ing 2018. Big data nyebar kanthi cepet menyang macem-macem sektor ekonomi, kalebu sales, marketing, riset lan pangembangan, logistik lan pancen kabeh liya. Miturut riset dening IBM, jumlah pakaryan profesional ing lapangan iki bakal ngluwihi 2,7 yuta ing taun 2020 ing Amerika Serikat. Janji? Sampeyan nang.

Big data lan Jawa

Saiki, kenapa data gedhe lan Jawa duwe persamaan? Bab iku akeh alat utama kanggo data gedhe sing ditulis ing Jawa. Apa maneh, meh kabeh alat kasebut minangka proyek sumber terbuka. Iki tegese kasedhiya kanggo kabeh wong lan mula digunakake kanthi aktif dening perusahaan IT paling gedhe ing saindenging jagad. "Kanggo ambane Big Data yaiku Jawa. Hadoop lan persentase gedhe saka ekosistem Hadoop ditulis ing Jawa. Antarmuka MapReduce asli kanggo Hadoop yaiku Jawa. Dadi sampeyan bisa kanthi gampang pindhah menyang data gedhe mung kanthi mbangun solusi Java sing mbukak ing ndhuwur. saka Hadoop. Ana uga perpustakaan Jawa kaya Cascading sing nggawe proyek luwih gampang. Jawa uga migunani banget kanggo debugging barang sanajan sampeyan nggunakake kaya Hive." ngandikaMarcin Mejran, ilmuwan data lan wakil presiden pangembangan data ing Eight. "Ngluwihi Hadoop, Storm ditulis ing Jawa lan Spark (yaiku: bisa diomongake masa depan komputasi hadoop) ana ing Scala (sing lumaku ing JVM lan Spark duwe antarmuka Java). Dadi Jawa nyakup persentase gedhe saka ruang Big Data, "tambah ahli kasebut. Kaya sing sampeyan ngerteni, kawruh babagan Jawa mung ora bisa diganti ing data gedhe, Internet, learning machine, lan sawetara ceruk liyane sing terus populer.
"Saben perusahaan duwe data gedhe ing mangsa ngarep lan saben perusahaan bakal ana ing bisnis data."
Lan saiki luwih akeh babagan alat data gedhe sing kasebut ing ndhuwur, sing akeh digunakake dening pangembang Java.

Apache Hadoop

Apache Hadoop minangka salah sawijining teknologi dhasar kanggo data gedhe, lan ditulis ing Jawa. Hadoop minangka paket utilitas, perpustakaan, lan kerangka open source gratis sing dikelola dening Apache Software Foundation. Asli digawe kanggo komputasi sing bisa diukur, disebarake, lan tahan kesalahan, uga nyimpen macem-macem informasi sing akeh banget, Hadoop kanthi alami dadi pusat infrastruktur data gedhe kanggo akeh perusahaan. Perusahaan ing saindenging jagad aktif nggoleki pakar Hadoop, lan Jawa minangka katrampilan utama sing dibutuhake kanggo nguwasani teknologi iki. Miturut pangembang ing Slashdot, ing 2019, akeh perusahaan gedhe, kalebu JPMorgan Chase, kanthi gaji sing mecah rekor kanggo programer, kanthi aktif nggoleki pakar Hadoop ing konferensi Hadoop World, nanging ing kana, dheweke ora bisa nemokake cukup ahli kanthi katrampilan sing dibutuhake (utamane, kawruh saka model lan kerangka pemrograman Hadoop MapReduce). Iki tegese gaji ing lapangan iki bakal tambah akeh. Lan dheweke wis gedhe banget. Khususe, Business Insider ngira manawa pakar Hadoop rata-rata regane $103,000 saben taun, dene biaya rata-rata spesialis data gedhe yaiku $106,000 saben taun. Perekrut sing golek pakar Hadoop nyorot Jawa minangka salah sawijining katrampilan sing paling penting kanggo kerja sing sukses. Hadoop wis suwe digunakake utawa dikenalake bubar dening akeh perusahaan gedhe, kalebu IBM, Microsoft, lan Oracle. Ing wayahe,
"Ing ngendi ana kumelun data, ana geni bisnis."

Apache Spark

Apache Spark minangka platform data gedhe liyane sing dadi pesaing serius Hadoop. Amarga kacepetan, keluwesan, lan penak sing ditawakake para pangembang, Apache Spark dadi lingkungan utama kanggo pangembangan skala gedhe ing SQL, data sing diowahi paket lan streaming, lan pembelajaran mesin. Minangka kerangka kanggo pangolahan data gedhe sing disebarake, Apache Spark bisa digunakake kaya kerangka Hadoop MapReduce lan mboko sithik ngrampok MapReduce ing data gedhe. Spark bisa digunakake kanthi macem-macem cara. Nduwe API kanggo Jawa, uga sawetara basa pamrograman liyane, kayata Scala, Python lan R. Saiki, Spark wis akeh digunakake dening bank, perusahaan telekomunikasi, pangembang video game, lan malah pemerintah. Mesthine, raksasa IT kaya Apple, Facebook, IBM lan Microsoft seneng Apache Spark.

Apache Mahout

Apache Mahout minangka perpustakaan pembelajaran mesin Java open source saka Apache. Iki minangka alat sinau mesin sing bisa diukur sing bisa ngolah data ing siji utawa luwih mesin. Implementasi machine learning ditulis ing Jawa, lan sawetara bagean dibangun ing Apache Hadoop.

Apache Storm

Apache Storm minangka kerangka kanggo pangolahan stream sing disebarake ing wektu nyata. Storm nyederhanakake pangolahan data tanpa wates sing ora bisa disalahake, nindakake kanthi nyata apa sing ditindakake Hadoop kanggo paket data. Storm nyawiji karo sistem antrian lan sistem database apa wae.

Java JFreeChart

Java JFreeChart minangka perpustakaan open source sing dikembangake ing Jawa lan dirancang kanggo digunakake ing aplikasi basis Java kanggo nggawe macem-macem grafik. Kasunyatane yaiku visualisasi data cukup penting kanggo sukses nganalisa data gedhe. Amarga data gedhe kalebu nggarap data sing akeh, bisa uga angel ngenali tren utawa malah nggawe kesimpulan tartamtu kanthi ndeleng data mentah. Nanging, yen data sing padha ditampilake ing grafik, dadi luwih bisa dingerteni. Iku luwih gampang kanggo nemokake pola lan ngenali korélasi. Kaya sing kedadeyan, Java JFreeChart mbantu nggawe grafik lan grafik kanggo analisis data gedhe.

DeepLearning4j

Deeplearning4j minangka perpustakaan Jawa sing digunakake kanggo mbangun macem-macem jinis jaringan saraf. Deeplearning4j dileksanakake ing Jawa lan mlaku ing JVM. Iku uga kompatibel karo Clojure lan kalebu API kanggo basa Scala. Deeplearning4j kalebu implementasi mesin Boltzmann sing diwatesi, jaringan kapercayan jero, autoencoder jero, autoencoder denoising ditumpuk, jaringan tensor saraf rekursif, word2vec, doc2vec lan GloVe.
"Data dadi bahan mentah anyar kanggo bisnis."

Big Data ing ambang 2020: tren paling anyar

2020 kudu dadi taun wutah lan evolusi kanthi cepet kanggo data gedhe, bebarengan karo adopsi data gedhe dening perusahaan lan organisasi ing macem-macem lapangan. Dadi, ayo nyorot kanthi ringkes tren data gedhe sing kudu dadi peran penting ing taun ngarep. Java lan Big Data: kenapa proyek Big Data ora bisa ditindakake tanpa Java - 3

https://www.arnnet.com.au/slideshow/553034/pictures-our-10-favourite-techie-simpsons-episodes-moments/

Internet samubarang - data gedhe saya gedhe

Internet of Things (IoT) bisa uga katon ora ana topik, nanging ora kaya ngono. IoT terus "tren" amarga entuk momentum lan nyebar ing saindenging jagad. Akibate, jumlah piranti "pinter" sing dipasang ing omah lan kantor uga saya akeh. Minangka kudune, piranti kasebut ngirim kabeh jinis data menyang ngendi wae. Iki tegese volume data gedhe mung bakal tuwuh. Miturut para ahli, akeh organisasi wis duwe akeh data, utamane saka IoT, sing ora disiapake kanthi apik. Ing taun 2020, longsoran data iki bakal dadi luwih gedhe. Akibate, investasi ing proyek data gedhe uga bakal mundhak kanthi cepet. Lan elinga, IoT uga seneng banget karo Jawa . Sapa sing ora seneng?

Kembar digital

Kembar digital minangka tren teka liyane sing ana hubungane langsung karo Internet of Things lan data gedhe. Mulane, Jawa bakal weruh akeh panggunaan ing kene. Apa sing kembar digital? Iki minangka replika digital saka obyek utawa sistem nyata. Analog digital saka piranti fisik ndadekake bisa simulasi proses internal obyek nyata, karakteristik teknis, lan prilaku miturut pengaruh gangguan lan lingkungane. A kembar digital ora bisa operate tanpa nomer ageng saka sensor ing piranti nyata digunakake ing podo karo. Ing taun 2020, samesthine bakal ana luwih saka 20 milyar sensor sing nyambungake ing saindenging jagad sing ngirim informasi kanggo milyaran kembar digital. Ing 2020, tren iki kudu entuk momentum lan dadi luwih maju.

Transformasi digital bakal dadi luwih disengaja.

Kanggo sawetara taun, transformasi digital wis kasebut minangka tren penting. Nanging para ahli ujar manawa akeh perusahaan lan manajer ndhuwur duwe pangerten sing ora jelas babagan apa tegese tembung kasebut. Kanggo akeh, transformasi digital tegese golek cara kanggo adol data sing dikumpulake perusahaan supaya bisa ngasilake aliran pendapatan anyar. Ing taun 2020, luwih akeh perusahaan sing ngerti yen transformasi digital yaiku nggawe keuntungan kompetitif kanthi nggunakake data kanthi bener ing saben aspek bisnis. Iki tegese kita bisa nyana yen perusahaan bakal nambah anggaran kanggo proyek sing ana gandhengane karo panggunaan data sing bener lan informed.
"We are obah alon menyang jaman ngendi Big Data minangka titik wiwitan, dudu pungkasan."
Pearl Zhu ,
penulis seri buku Digital Master

Ringkesan

Data gedhe minangka area kegiatan liyane sing gedhe banget kanthi akeh kesempatan kanggo pangembang Jawa. Saliyane Internet of Things, wilayah iki berkembang lan ngalami kekurangan programer lan ahli teknis liyane. Dadi saiki wis wayahe mandheg maca artikel-artikel sing dawa iki lan sinau basa Jawa!
Komentar
TO VIEW ALL COMMENTS OR TO MAKE A COMMENT,
GO TO FULL VERSION