CodeGym /Java Blog /ランダム /Java とビッグデータ: Java なしではビッグデータ プロジェクトが成り立たない理由
John Squirrels
レベル 41
San Francisco

Java とビッグデータ: Java なしではビッグデータ プロジェクトが成り立たない理由

ランダム グループに公開済み
CodeGym に関する記事では、25 年が経過した Java が再び人気を博しており、近い将来に輝かしい展望があることを何度も言及しています。これにはいくつかの理由があります。その 1 つは、Java が急速に人気を集めているいくつかのトレンドの IT 市場ニッチ分野で主要なプログラミング言語であるということです。 Java とビッグデータ: Java なしではビッグデータ プロジェクトが成り立たない理由 - 1 モノのインターネット (IoT) とビッグ データ、ビジネス インテリジェンス (BI)、リアルタイム分析は、Java に対する深い愛情と優しい感情の文脈で最も頻繁に言及されます。最近、私たちはJava とモノのインターネットの関係について調査しました。そして、Java 開発者が自分のスキルをこのニッチに合わせて調整する方法について話しました。ここで、もう 1 つの超トレンドの分野に注目します。この分野も、ご想像のとおり、Java が大好きで、Java なしでは生きていけません。そこで、今日はビッグ データに関連して次の疑問を検討していきます。なぜ Java が、したがって忠実な Java プログラマーがこのニッチ市場で非常に人気があるのでしょうか? Java はビッグデータ プロジェクトでどのように正確に使用されますか? このニッチな分野で雇用される資格を得るには何を学べばよいでしょうか? ビッグデータの現在のトレンドは何ですか? これらすべての合間に、ホーマー シンプソンですらビッグ データを扱いたいと思わせるような、ビッグ データに関する世界トップの専門家の意見を見ていきます。 Java とビッグデータ: Java なしではビッグデータ プロジェクトが成り立たない理由 - 2

https://ru.wikipedia.org/wiki/Homer_Goes_to_College

「私は、今後10年間のセクシーな仕事は統計学者になるだろうと言い続けています。人々は私が冗談だと​​思っていますが、1990年代のセクシーな仕事がコンピューターエンジニアになるとは誰が予想したでしょうか?」

ビッグデータが地球を征服しつつある

その前に、ビッグデータと、このニッチ分野がキャリア構築に非常に有望である理由について少し説明します。つまり、ビッグデータは容赦なく、着実に、そして(最も重要なことに)非常に急速に世界中の企業のビジネスプロセスに侵入しつつあります。そうした企業は、今度はデータサイエンスの専門家(もちろんプログラマーだけではない)を見つけ、高額の給与やその他の特典で彼らを誘惑することを余儀なくされている。Forbes によると、企業におけるビッグデータの使用が増加2015 年の 17% から 2018 年には 59% に増加しました。ビッグデータは、販売、マーケティング、研究開発、物流、その他あらゆるものを含む経済のさまざまな分野に急速に普及しています。IBMの調査によると、この分野の専門家の雇用数は2020年までに米国だけで270万人を超えると予想されています。有望な?きっと。

ビッグデータとJava

では、なぜビッグデータと Java にはこれほど多くの共通点があるのでしょうか? 問題は、ビッグ データ用の主要なツールの多くが Java で書かれているということです。さらに、これらのツールのほぼすべてはオープンソース プロジェクトです。これは、誰でも利用できるため、世界中の最大手の IT 企業によって積極的に使用されていることを意味します。「ビッグ データの大部分は Java です。Hadoop と Hadoop エコシステムの大部分は Java で書かれています。Hadoop のネイティブ MapReduce インターフェイスは Java です。そのため、その上で実行される Java ソリューションを構築するだけで、簡単にビッグ データに移行できます。」 「Hadoop のようなものです。作業を容易にする Cascading のような Java ライブラリもあります。Java は、Hive などを使用する場合でも、デバッグに非常に役立ちます。」言ったMarcin Mejran 氏は、データ サイエンティストであり、Eight のデータ開発担当副社長です。「Hadoop を超えて、Storm は Java で書かれており、Spark (つまり、おそらく Hadoop コンピューティングの未来) は Scala (JVM 上で実行され、Spark には Java インターフェイスがあります) で書かれています。そのため、Java はビッグ データ スペースの大部分をカバーしています。 」と専門家は付け加えた。ご覧のとおり、Java の知識は、ビッグ データ、モノのインターネット、機械学習、その他の人気が高まるいくつかの分野において、かけがえのないものとなるでしょう。
「将来的にはあらゆる企業がビッグデータを持ち、最終的にはあらゆる企業がデータ ビジネスに参入することになるでしょう。」
Thomas H. Davenport 氏
アメリカの学者、分析とビジネス プロセス イノベーションの専門家
ここで、Java 開発者によって広く使用されている前述のビッグ データ ツールについてもう少し詳しく説明します。

アパッチ・ハドゥープ

Apache Hadoop はビッグデータの基盤技術の 1 つであり、Java で書かれています。Hadoop は、Apache Software Foundation によって管理されている、ユーティリティ、ライブラリ、およびフレームワークの無料のオープンソース スイートです。Hadoop は、もともとスケーラブルで分散型のフォールト トレラント コンピューティングと、膨大な量のさまざまな情報を保存するために作成されたもので、当然のことながら多くの企業にとってビッグ データ インフラストラクチャの中心となっています。世界中の企業が Hadoop の専門家を積極的に探しており、Java はこのテクノロジーを習得するために必要な重要なスキルです。スラッシュドットの開発者によると、2019年、プログラマーの記録的な給与を誇るJPモルガン・チェースを含む多くの大企業が、Hadoop WorldカンファレンスでHadoopの専門家を積極的に探しましたが、そこでも必要なスキル(特に知識、知識)を備えた十分な専門家を見つけることができませんでした。 Hadoop MapReduce プログラミング モデルとフレームワークの)。これは、この分野の給与がさらに増加することを意味します。そして彼らはすでにとても大きくなりました。特に、Business Insider は、Hadoop エキスパートの平均コストが年間 103,000 ドルであるのに対し、ビッグデータ スペシャリストの平均コストは年間 106,000 ドルであると推定しています。Hadoop エキスパートを探している採用担当者は、就職を成功させるための最も重要なスキルの 1 つとして Java を強調しています。Hadoop は、IBM、Microsoft、Oracle などの多くの大企業で長年使用されてきたか、比較的最近導入されました。この時点で、
「データの煙があるところには、ビジネスの火も存在します。」

アパッチスパーク

Apache Spark は、Hadoop の深刻な競合相手であるもう 1 つの重要なビッグ データ プラットフォームです。Apache Spark は、開発者に提供される速度、柔軟性、利便性により、SQL、パケット交換データとストリーミング データ、機械学習の大規模開発の主要な環境になりつつあります。分散ビッグ データ処理のフレームワークとして、Apache Spark は Hadoop MapReduce フレームワークとよく似た動作をし、ビッグ データにおける MapReduce の優位性を徐々に奪いつつあります。Spark はさまざまな方法で使用できます。Spark には Java 用の API のほか、Scala、Python、R などの他のいくつかのプログラミング言語があります。現在、Spark は銀行、通信会社、ビデオ ゲーム開発者、さらには政府によって広く使用されています。当然のことながら、Apple、Facebook、IBM、Microsoft などの巨大 IT 企業は Apache Spark を愛用しています。

アパッチの象使い

Apache Mahout は、Apache のオープンソース Java 機械学習ライブラリです。これは、1 つ以上のマシンでデータを処理できるスケーラブルな機械学習ツールです。機械学習の実装は Java で書かれており、一部の部分は Apache Hadoop 上に構築されています。

アパッチの嵐

Apache Storm は、リアルタイムの分散ストリーム処理のためのフレームワークです。Storm は、無制限のデータ ストリームのフォールト トレラントな処理を簡素化し、Hadoop がデータ パケットに対して行うことをリアルタイムで実行します。Storm は、あらゆるキューイング システムおよびデータベース システムと統合します。

Java JFreeChart

Java JFreeChart は、Java で開発されたオープン ソース ライブラリで、Java ベースのアプリケーションでさまざまなグラフを作成するために設計されています。実際、ビッグデータをうまく分析するには、データの視覚化が非常に重要です。ビッグデータでは大量のデータを操作する必要があるため、生データを調べて傾向を特定したり、特定の結論に達することさえ困難な場合があります。しかし、同じデータをグラフで表示すると、よりわかりやすくなります。パターンを見つけて相関関係を特定するのが簡単になります。偶然にも、Java JFreeChart は、ビッグ データ分析用のグラフやチャートの作成に役立ちます。

ディープラーニング4j

Deeplearning4j は、さまざまなタイプのニューラル ネットワークを構築するために使用される Java ライブラリです。Deeplearning4j は Java で実装され、JVM で実行されます。Clojure とも互換性があり、Scala 言語用の API が含まれています。Deeplearning4j には、制限付きボルツマン マシン、ディープ ビリーフ ネットワーク、ディープ オートエンコーダー、スタックド ノイズ除去オートエンコーダー、再帰的ニューラル テンソル ネットワーク、word2vec、doc2vec、および GloVe の実装が含まれています。
「データはビジネスの新たな素材になりつつあります。」

2020 年を迎えるビッグデータ: 最新のトレンド

2020 年は、ビッグデータがさらに急速に成長し進化し、さまざまな分野の企業や組織でビッグデータが広く導入される年になるはずです。そこで、来年重要な役割を果たすであろうビッグデータのトレンドを簡単に紹介しましょう。 Java とビッグデータ: Java なしではビッグデータ プロジェクトが成り立たない理由 - 3

https://www.arnnet.com.au/slideshow/553034/pictures-our-10-favourite-techie-simpsons-episodes-moments/

モノのインターネット — ビッグデータは増大する

モノのインターネット (IoT) は本題から外れているように思えるかもしれませんが、そうではありません。IoT は勢いを増し、世界中に広がりながら「トレンド」を続けています。その結果、家庭やオフィスに設置される「スマート」デバイスの数も増加しています。当然のことながら、これらのデバイスはあらゆる種類のデータを必要な場所に送信しています。これは、ビッグデータの量が増える一方であることを意味します。専門家によると、多くの組織はすでに主に IoT からの大量のデータを保有していますが、それらを使用する準備が十分ではありません。2020 年には、このデータ雪崩はさらに大きくなるでしょう。その結果、ビッグデータプロジェクトへの投資も急速に増加するだろう。そして、IoT もJava を非常に好んでいるということを忘れないでください。気に入らない人はいないでしょうか?

デジタルツイン

デジタル ツインは、モノのインターネットとビッグ データに直接関連するもう 1 つの興味深い今後のトレンドです。したがって、ここでは Java がかなり使用されることになります。デジタルツインとは何ですか? これは、実際のオブジェクトまたはシステムのデジタル レプリカです。物理デバイスのデジタル アナログにより、実際のオブジェクトの内部プロセス、技術的特性、および干渉やその環境の影響下での動作をシミュレートすることができます。デジタル ツインは、実際のデバイス内の膨大な数のセンサーが並行して動作しなければ動作できません。2020 年までに、世界中で 200 億を超えるセンサーが接続され、数十億のデジタル ツインの情報が送信されるようになると予想されます。2020 年には、この傾向がさらに勢いを増し、顕著になるはずです。

デジタル変革はより意図的なものになるでしょう。

ここ数年、デジタルトランスフォーメーションが重要なトレンドとして指摘されてきました。しかし専門家らによると、多くの企業や経営陣はこの言葉が何を意味するのかについて非常に漠然とした理解を持っていたという。多くの人にとって、デジタル変革とは、新たな収益源を生み出すために企業が収集したデータを販売する方法を見つけることを意味していました。2020 年までに、デジタル変革とはビジネスのあらゆる側面でデータを適切に活用することで競争上の優位性を生み出すことであると認識する企業がますます増えています。これは、企業が情報に基づいた正しいデータの使用に関連するプロジェクトの予算を増やすことが期待できることを意味します。
「私たちは、ビッグデータが終わりではなく出発点である時代にゆっくりと移行しつつあります。」
Pearl Zhu 氏
デジタル マスター ブック シリーズの著者

まとめ

ビッグ データは、Java 開発者にとって多くのチャンスをもたらす、もう 1 つの真に巨大な活動分野です。モノのインターネットに加えて、この分野は急成長を遂げていますが、プログラマーやその他の技術専門家の深刻な不足に悩まされています。それでは、これらの長い記事を読むのをやめて、Java の学習を始めましょう。
コメント
TO VIEW ALL COMMENTS OR TO MAKE A COMMENT,
GO TO FULL VERSION