CodeGym /Java Blogu /Rastgele /Java ve Büyük Veri: Büyük Veri projeleri neden Java olmad...
John Squirrels
Seviye
San Francisco

Java ve Büyük Veri: Büyük Veri projeleri neden Java olmadan yapamaz?

grupta yayınlandı
CodeGym'deki makalelerimizde, şu anda 25 yaşında olan Java'nın yenilenen bir popülariteye sahip olduğundan ve yakın gelecekte parlak umutlara sahip olduğundan bahsetmekten asla bıkmıyoruz. Bunun birkaç nedeni var. Bunlardan biri, Java'nın hızla popülerlik kazanan birkaç trend BT pazarı nişinde ana programlama dili olmasıdır. Java ve Büyük Veri: Büyük Veri projeleri neden Java olmadan yapamaz - 1 Nesnelerin İnterneti (IoT) ve büyük verinin yanı sıra iş zekası (BI) ve gerçek zamanlı analitikten en çok Java'ya duyulan derin sevgi ve hassas duygular bağlamında bahsedilir. Son zamanlarda, Java ile nesnelerin interneti arasındaki ilişkiyi inceledik.ve bir Java geliştiricisinin becerilerini bu nişe göre nasıl uyarlayabileceğinden bahsetti. Şimdi dikkatimizi - tahmin ettiğiniz gibi - Java'yı da seven ve onsuz yaşayamayan başka bir süper trend alanına çeviriyoruz. Bu nedenle, bugün büyük verilerle ilgili olarak şu soruları inceleyeceğiz: Java ve dolayısıyla sadık Java kodlayıcıları da bu niş içinde neden süper popüler? Java büyük veri projelerinde tam olarak nasıl kullanılır? Bu nişte istihdam için kalifiye olmak için ne öğrenmelisiniz? ve büyük verideki mevcut eğilimler nelerdir? Ve tüm bunların arasında, dünyanın en iyi uzmanlarının büyük veri konusundaki görüşlerine bakacağız ki bu, Homer Simpson'ın bile büyük veri ile çalışmak istemesine neden olabilir. Java ve Büyük Veri: Büyük Veri projeleri neden Java olmadan yapamaz - 2

https://ru.wikipedia.org/wiki/Homer_Goes_to_College

"Önümüzdeki on yıldaki seksi işin istatistikçiler olacağını söyleyip duruyorum. İnsanlar şaka yaptığımı düşünüyor ama bilgisayar mühendislerinin 1990'ların seksi işi olacağını kim tahmin edebilirdi?"

Google'ın baş ekonomisti Hal Varian

Büyük veri gezegeni fethediyor

Ama önce, biraz büyük veri ve bu nişin bir kariyer oluşturmak için neden bu kadar umut verici olduğu hakkında biraz. Kısacası, büyük veri kaçınılmaz bir şekilde, istikrarlı bir şekilde ve (en önemlisi) dünya çapındaki şirketlerin iş süreçlerine çok hızlı bir şekilde giriyor. Bu şirketler de veri bilimi profesyonelleri (elbette sadece programcılar değil) bulmaya zorlanıyor ve onları yüksek maaşlar ve diğer avantajlarla cezbediyor. Forbes'a göre işletmelerde büyük veri kullanımı arttı2015'te %17'den 2018'de %59'a. Büyük veri, satış, pazarlama, araştırma ve geliştirme, lojistik ve kesinlikle diğer her şey dahil olmak üzere ekonominin çeşitli sektörlerine hızla yayılıyor. IBM tarafından yapılan araştırmaya göre, bu alandaki profesyoneller için iş sayısı 2020 yılına kadar yalnızca Amerika Birleşik Devletleri'nde 2,7 milyonu aşacak. umut verici? Emin ol.

Büyük veri ve Java

Öyleyse, büyük veri ve Java'nın neden bu kadar çok ortak noktası var? Mesele şu ki, büyük veri için ana araçların çoğu Java'da yazılmıştır. Üstelik bu araçların neredeyse tamamı açık kaynaklı projelerdir. Bu, herkesin kullanımına açık oldukları ve dolayısıyla dünyanın en büyük BT şirketleri tarafından aktif olarak kullanıldığı anlamına gelir. "Büyük Veri büyük ölçüde Java'dır. Hadoop ve Hadoop ekosisteminin büyük bir yüzdesi Java'da yazılmıştır. Hadoop için yerel MapReduce arabirimi Java'dır. Dolayısıyla, üstte çalışan Java çözümleri oluşturarak büyük verilere kolayca geçebilirsiniz. Hadoop. Ayrıca, işi kolaylaştıran Cascading gibi Java kitaplıkları da var. Java, Hive gibi bir şey kullansanız bile hata ayıklamak için gerçekten yararlıdır." söz konusuEight'ta veri bilimcisi ve veri geliştirmeden sorumlu başkan yardımcısı Marcin Mejran. "Hadoop'un ötesinde, Storm Java'da yazılmıştır ve Spark (yani: muhtemelen hadoop bilgi işlemin geleceği) Scala'dadır (JVM üzerinde çalışır ve Spark bir Java arayüzüne sahiptir). Dolayısıyla Java, Büyük Veri alanının büyük bir yüzdesini kaplar, " diye ekliyor uzman. Gördüğünüz gibi, Java bilgisi büyük verilerde, nesnelerin internetinde, makine öğreniminde ve popülerlik kazanmaya devam eden diğer birçok nişte yeri doldurulamaz olacak.
"Her şirketin geleceği büyük veriye sahiptir ve her şirket eninde sonunda veri işinde olacaktır."

Amerikalı bir akademisyen ve analitik ve iş süreci yeniliği uzmanı Thomas H. Davenport
Ve şimdi, Java geliştiricileri tarafından yaygın olarak kullanılan, yukarıda bahsedilen büyük veri araçları hakkında biraz daha bilgi.

Apache Hadoop'u

Apache Hadoop, büyük veri için temel teknolojilerden biridir ve Java ile yazılmıştır. Hadoop, Apache Software Foundation tarafından yönetilen ücretsiz, açık kaynaklı bir yardımcı programlar, kitaplıklar ve çerçeveler paketidir. Orijinal olarak ölçeklenebilir, dağıtılmış ve hataya dayanıklı bilgi işlem ve çok miktarda çeşitli bilgiyi depolamak için yaratılan Hadoop, doğal olarak birçok şirket için büyük veri altyapısının en önemli parçası haline geliyor. Dünyanın dört bir yanındaki şirketler aktif olarak Hadoop uzmanları arıyor ve Java, bu teknolojide uzmanlaşmak için gereken temel bir beceridir. Slashdot'taki geliştiricilere göre2019'da, programcılar için rekor kıran maaşları olan JPMorgan Chase dahil olmak üzere birçok büyük şirket, Hadoop Dünya konferansında aktif olarak Hadoop uzmanları aradı, ancak orada bile gerekli becerilere (özellikle bilgi birikimine) sahip yeterli uzmanı bulamadılar. Hadoop MapReduce programlama modeli ve çerçevesi). Bu da bu alandaki maaşların daha da artacağı anlamına geliyor. Ve zaten çok büyükler. Business Insider, özellikle, ortalama bir Hadoop uzmanının yıllık maliyetinin 103.000 ABD Doları olduğunu, büyük veri uzmanlarının ortalama maliyetinin ise yıllık 106.000 ABD Doları olduğunu tahmin etmektedir. Hadoop uzmanları arayan işe alım görevlileri, Java'yı başarılı istihdam için en önemli becerilerden biri olarak vurgulamaktadır. Hadoop, IBM, Microsoft ve Oracle dahil olmak üzere birçok büyük şirket tarafından uzun süredir kullanılıyor veya nispeten yakın zamanda tanıtıldı. Şu anda,
"Veri dumanının olduğu yerde iş yangını vardır."

Veri analitiği ve dijital teknolojide ünlü bir uzman olan Dr. Thomas Redman

apaçi kıvılcımı

Apache Spark, Hadoop'un ciddi bir rakibi olan bir diğer önemli büyük veri platformudur. Geliştiricilere sunduğu hız, esneklik ve kolaylık nedeniyle Apache Spark, SQL, paket anahtarlamalı ve akışlı veriler ve makine öğreniminde büyük ölçekli geliştirme için lider ortam haline geliyor. Dağıtılmış büyük veri işlemeye yönelik bir çerçeve olarak Apache Spark, Hadoop MapReduce çerçevesine çok benzer şekilde çalışır ve MapReduce'un büyük verilerdeki önceliğini yavaş yavaş elinden alıyor. Spark birçok farklı şekilde kullanılabilir. Java'nın yanı sıra Scala, Python ve R gibi diğer birkaç programlama dili için bir API'ye sahiptir. Spark bugün bankalar, telekomünikasyon şirketleri, video oyun geliştiricileri ve hatta hükümetler tarafından yaygın olarak kullanılmaktadır. Doğal olarak Apple, Facebook, IBM ve Microsoft gibi BT devleri Apache Spark'ı seviyor.

Apaçi Mahout

Apache Mahout, Apache'den açık kaynaklı bir Java makine öğrenimi kitaplığıdır. Bir veya daha fazla makinedeki verileri işleyebilen ölçeklenebilir bir makine öğrenimi aracıdır. Makine öğrenimi uygulamaları Java'da yazılmıştır ve bazı bölümler Apache Hadoop'ta oluşturulmuştur.

Apaçi Fırtınası

Apache Storm, gerçek zamanlı olarak dağıtılmış akış işleme için bir çerçevedir. Storm, Hadoop'un veri paketleri için yaptığını gerçek zamanlı olarak yaparak, sınırsız veri akışının hataya dayanıklı işlenmesini basitleştirir. Storm, herhangi bir kuyruk sistemi ve herhangi bir veritabanı sistemi ile entegre olur.

Java JFreeChart

Java JFreeChart, Java'da geliştirilen ve çok çeşitli grafikler oluşturmak için Java tabanlı uygulamalarda kullanılmak üzere tasarlanmış açık kaynaklı bir kitaplıktır. Gerçek şu ki, büyük verileri başarılı bir şekilde analiz etmek için veri görselleştirme oldukça önemlidir. Büyük veri, büyük miktarda veriyle çalışmayı gerektirdiğinden, ham verilere bakarak eğilimleri belirlemek ve hatta belirli sonuçlara varmak zor olabilir. Ancak aynı veriler bir grafikte gösterilirse daha anlaşılır hale gelir. Kalıpları bulmak ve korelasyonları belirlemek daha kolaydır. Java JFreeChart, büyük veri analizi için grafikler ve çizelgeler oluşturmaya yardımcı olur.

Derin öğrenme4j

Deeplearning4j, çeşitli türlerde sinir ağları oluşturmak için kullanılan bir Java kitaplığıdır. Deeplearning4j, Java'da uygulanır ve JVM'de çalışır. Ayrıca Clojure ile uyumludur ve Scala dili için bir API içerir. Deeplearning4j, kısıtlı bir Boltzmann makinesi, derin inanç ağı, derin otomatik kodlayıcı, yığılmış gürültü giderici otomatik kodlayıcı, özyinelemeli nöral tensör ağı, word2vec, doc2vec ve GloVe'nin bir uygulamasını içerir.
"Veriler iş dünyasının yeni ham maddesi haline geliyor."

2020 eşiğinde Büyük Veri: en yeni trendler

2020, büyük verinin çeşitli alanlardaki şirketler ve kuruluşlar tarafından yaygın olarak benimsenmesinin yanı sıra, büyük veri için hızlı bir büyüme ve evrim yılı olmalıdır. Öyleyse, önümüzdeki yıl önemli bir rol oynaması gereken büyük verideki eğilimleri kısaca vurgulayalım. Java ve Büyük Veri: Büyük Veri projeleri neden Java olmadan yapamaz - 3

https://www.arnnet.com.au/slideshow/553034/pictures-our-10-favourite-techie-simpsons-episodes-moments/

Nesnelerin interneti — büyük veri büyüyor

Nesnelerin İnterneti (IoT) konu dışı gibi görünebilir, ancak durum bu değil. IoT, ivme kazanıp dünyaya yayıldıkça "trend" olmaya devam ediyor. Sonuç olarak, evlere ve ofislere kurulan "akıllı" cihazların sayısı da artıyor. Olması gerektiği gibi, bu cihazlar her türlü veriyi gitmesi gereken yere gönderiyor. Bu, büyük veri hacminin yalnızca büyüyeceği anlamına gelir. Uzmanlara göre, birçok kuruluş halihazırda, kullanmaya iyi hazırlanmadıkları, başta IoT'den olmak üzere çok sayıda veriye sahip. 2020'de bu veri çığı daha da büyüyecek. Sonuç olarak, büyük veri projelerine yapılan yatırımlar da hızla artacaktır. Ayrıca IoT'nin de Java'yı çok sevdiğini unutmayın . Kim sevmez?

Dijital ikizler

Dijital ikizler, Nesnelerin İnterneti ve büyük verilerle doğrudan ilgili olan bir başka ilginç trend. Buna göre, Java burada oldukça fazla kullanım görecek. Dijital ikiz nedir? Bu, gerçek bir nesnenin veya sistemin dijital bir kopyasıdır. Fiziksel bir cihazın dijital analoğu, gerçek bir nesnenin iç süreçlerini, teknik özelliklerini ve girişimin ve çevresinin etkisi altındaki davranışını simüle etmeyi mümkün kılar. Bir dijital ikiz, gerçek cihazda paralel çalışan çok sayıda sensör olmadan çalışamaz. 2020 yılına kadar, küresel olarak milyarlarca dijital ikiz için bilgi ileten 20 milyardan fazla bağlantılı sensörün olması bekleniyor. 2020'de bu trend ivme kazanmalı ve ön plana çıkmalı.

Dijital dönüşüm daha bilinçli hale gelecek.

Birkaç yıldır dijital dönüşümden önemli bir trend olarak bahsediliyor. Ancak uzmanlar, birçok şirketin ve üst düzey yöneticinin bu ifadenin ne anlama geldiği konusunda son derece belirsiz bir anlayışa sahip olduğunu söylüyor. Birçoğu için dijital dönüşüm, şirketin yeni gelir akışları oluşturmak için topladığı verileri satmanın yollarını bulmak anlamına geliyordu. 2020'ye gelindiğinde, giderek daha fazla şirket, dijital dönüşümün, verileri işlerinin her alanında doğru bir şekilde kullanarak rekabet avantajı yaratmakla ilgili olduğunun farkına varıyor. Bu, şirketlerin verilerin doğru ve bilinçli kullanımıyla ilgili projeler için bütçelerini artırmasını bekleyebileceğimiz anlamına gelir.
"Büyük Verinin son değil, başlangıç ​​noktası olduğu bir döneme doğru yavaş yavaş ilerliyoruz."
Pearl Zhu ,
Digital Master kitap serisinin yazarı

Özet

Büyük veri, Java geliştiricileri için pek çok fırsat sunan gerçekten muazzam bir faaliyet alanıdır. Nesnelerin İnterneti'ne ek olarak, bu alan patlama yaşıyor ve ciddi bir programcı ve diğer teknik uzman eksikliği çekiyor. O halde artık bu uzun makaleleri okumayı bırakıp Java öğrenmeye başlamanın zamanı geldi!
Yorumlar
TO VIEW ALL COMMENTS OR TO MAKE A COMMENT,
GO TO FULL VERSION