CodeGym /Blog Java /Random-ES /Java y Big Data: por qué los proyectos de Big Data no pue...
John Squirrels
Nivel 41
San Francisco

Java y Big Data: por qué los proyectos de Big Data no pueden prescindir de Java

Publicado en el grupo Random-ES
En nuestros artículos sobre CodeGym, no nos cansamos de mencionar que Java, que ya tiene 25 años, goza de una renovada popularidad y tiene brillantes perspectivas en el futuro cercano. Hay varias razones para esto. Uno de ellos es que Java es el lenguaje de programación principal en varios nichos de mercado de TI de tendencia que están ganando popularidad rápidamente. Java y Big Data: por qué los proyectos de Big Data no pueden prescindir de Java - 1 El Internet de las cosas (IoT) y los grandes datos, así como la inteligencia empresarial (BI) y el análisis en tiempo real se mencionan con mayor frecuencia en el contexto de un profundo afecto y tiernos sentimientos por Java. Recientemente, exploramos la relación entre Java e Internet de las cosasy habló sobre cómo un desarrollador de Java puede adaptar sus habilidades a este nicho. Ahora dirigimos nuestra atención a otra área de súper tendencia que, lo adivinaste, también ama a Java y no puede vivir sin él. Entonces, hoy exploraremos las siguientes preguntas en relación con los grandes datos: ¿por qué Java, y por lo tanto los leales codificadores de Java, también son muy populares en este nicho? ¿Cómo se usa exactamente Java en proyectos de big data? ¿Qué debe aprender para estar calificado para el empleo en este nicho? y ¿cuáles son las tendencias actuales en big data? Y entre todo esto, veremos las opiniones de los principales expertos mundiales en big data, lo que haría que incluso Homer Simpson quisiera trabajar con big data. Java y Big Data: por qué los proyectos de Big Data no pueden prescindir de Java - 2

https://ru.wikipedia.org/wiki/Homer_Goes_to_College

"Sigo diciendo que el trabajo sexy en los próximos diez años será el de estadístico. La gente piensa que estoy bromeando, pero ¿quién hubiera imaginado que los ingenieros informáticos serían el trabajo sexy de la década de 1990?".

Big data está conquistando el planeta

Pero primero, un poco sobre big data y por qué este nicho es tan prometedor para construir una carrera. En resumen, los grandes datos se están abriendo camino de manera inexorable, constante y (lo que es más importante) muy rápidamente en los procesos comerciales de empresas de todo el mundo. Esas empresas, a su vez, se ven obligadas a encontrar profesionales de la ciencia de datos (no solo programadores, por supuesto), atrayéndolos con altos salarios y otras ventajas. Según Forbes, aumentó el uso de big data en las empresasdel 17 % en 2015 al 59 % en 2018. Big data se está extendiendo rápidamente a varios sectores de la economía, incluidos ventas, marketing, investigación y desarrollo, logística y absolutamente todo lo demás. Según una investigación de IBM, la cantidad de puestos de trabajo para profesionales en este campo superará los 2,7 millones para 2020 solo en los Estados Unidos. ¿Prometedor? tu apuesta

Grandes datos y Java

Ahora bien, ¿por qué el big data y Java tienen tanto en común? La cuestión es que muchas de las principales herramientas para big data están escritas en Java. Además, casi todas estas herramientas son proyectos de código abierto. Esto significa que están disponibles para todos y, por lo tanto, las empresas de TI más grandes del mundo las utilizan activamente. "En gran medida, Big Data es Java. Hadoop y un gran porcentaje del ecosistema de Hadoop están escritos en Java. La interfaz nativa de MapReduce para Hadoop es Java. Por lo tanto, puede pasar fácilmente a Big Data simplemente creando soluciones Java que se ejecutan en la parte superior de Hadoop. También hay bibliotecas de Java como Cascading que facilitan el trabajo. Java también es muy útil para depurar cosas, incluso si usa algo como Hive". dichoMarcin Mejran, científico de datos y vicepresidente de desarrollo de datos en Eight. "Más allá de Hadoop, Storm está escrito en Java y Spark (es decir, posiblemente el futuro de la computación Hadoop) está en Scala (que se ejecuta en JVM y Spark tiene una interfaz Java). Por lo tanto, Java cubre un porcentaje masivo del espacio Big Data, ", agrega el experto. Como puede ver, el conocimiento de Java será simplemente insustituible en big data, Internet de las cosas, aprendizaje automático y varios otros nichos que continúan ganando popularidad.
"Cada empresa tiene grandes datos en su futuro y todas las empresas eventualmente estarán en el negocio de los datos".
Thomas H. Davenport ,
académico estadounidense y experto en análisis e innovación de procesos comerciales
Y ahora un poco más sobre las herramientas de big data antes mencionadas, que son ampliamente utilizadas por los desarrolladores de Java.

apache hadoop

Apache Hadoop es una de las tecnologías fundamentales para big data y está escrito en Java. Hadoop es un conjunto gratuito de código abierto de utilidades, bibliotecas y marcos administrados por Apache Software Foundation. Originalmente creado para computación escalable, distribuida y tolerante a fallas, además de almacenar grandes cantidades de información diversa, Hadoop se está convirtiendo naturalmente en la pieza central de la infraestructura de big data para muchas empresas. Empresas de todo el mundo buscan activamente expertos en Hadoop, y Java es una habilidad clave necesaria para dominar esta tecnología. Según los desarrolladores de Slashdot, en 2019, muchas grandes empresas, incluida JPMorgan Chase, con sus salarios récord para programadores, buscaron activamente expertos de Hadoop en la conferencia mundial de Hadoop, pero incluso allí, no pudieron encontrar suficientes expertos con las habilidades necesarias (particularmente, conocimiento del modelo y marco de programación Hadoop MapReduce). Esto significa que los salarios en este campo crecerán aún más. Y ya son muy grandes. En particular, Business Insider estima que el costo promedio de un experto en Hadoop es de $103 000 por año, mientras que el costo promedio de los especialistas en big data es de $106 000 por año. Los reclutadores que buscan expertos en Hadoop destacan Java como una de las habilidades más importantes para un empleo exitoso. Hadoop se ha utilizado durante mucho tiempo o fue introducido relativamente recientemente por muchas grandes corporaciones, incluidas IBM, Microsoft y Oracle. En este momento,
"Donde hay humo de datos, hay fuego comercial".
Dr. Thomas Redman ,
un reconocido experto en análisis de datos y tecnología digital

chispa apache

Apache Spark es otra importante plataforma de big data que es un serio competidor de Hadoop. Debido a la velocidad, la flexibilidad y la comodidad que ofrece a los desarrolladores, Apache Spark se está convirtiendo en el entorno líder para el desarrollo a gran escala en SQL, transmisión de datos y conmutación de paquetes, y aprendizaje automático. Como marco para el procesamiento distribuido de big data, Apache Spark funciona de manera muy similar al marco de Hadoop MapReduce y está despojando gradualmente a MapReduce de su primacía en big data. Spark se puede utilizar de muchas maneras diferentes. Tiene una API para Java, así como varios otros lenguajes de programación, como Scala, Python y R. Hoy en día, Spark es muy utilizado por bancos, empresas de telecomunicaciones, desarrolladores de videojuegos e incluso gobiernos. Naturalmente, los gigantes de TI como Apple, Facebook, IBM y Microsoft adoran Apache Spark.

Mahout apache

Apache Mahout es una biblioteca de aprendizaje automático Java de código abierto de Apache. Es una herramienta escalable de aprendizaje automático que puede procesar datos en una o más máquinas. Las implementaciones de aprendizaje automático están escritas en Java y algunas partes están construidas en Apache Hadoop.

tormenta apache

Apache Storm es un marco para el procesamiento de flujo distribuido en tiempo real. Storm simplifica el procesamiento tolerante a fallas de flujos de datos ilimitados, haciendo en tiempo real lo que hace Hadoop para los paquetes de datos. Storm se integra con cualquier sistema de colas y cualquier sistema de base de datos.

Java JFreeChart

Java JFreeChart es una biblioteca de código abierto desarrollada en Java y diseñada para su uso en aplicaciones basadas en Java para crear una amplia variedad de gráficos. El hecho es que la visualización de datos es bastante importante para analizar con éxito los grandes datos. Debido a que Big Data implica trabajar con grandes cantidades de datos, puede ser difícil identificar tendencias o incluso llegar a conclusiones particulares al observar los datos sin procesar. Pero, si los mismos datos se muestran en un gráfico, se vuelve más comprensible. Es más fácil encontrar patrones e identificar correlaciones. Da la casualidad de que Java JFreeChart ayuda a crear gráficos y tablas para el análisis de big data.

aprendizaje profundo4j

Deeplearning4j es una biblioteca de Java utilizada para construir varios tipos de redes neuronales. Deeplearning4j está implementado en Java y se ejecuta en JVM. También es compatible con Clojure e incluye una API para el lenguaje Scala. Deeplearning4j incluye una implementación de una máquina Boltzmann restringida, red de creencias profundas, codificador automático profundo, codificador automático de eliminación de ruido apilado, red de tensor neuronal recursivo, word2vec, doc2vec y GloVe.
"Los datos se están convirtiendo en la nueva materia prima para los negocios".
Craig Mundie ,
asesor sénior del director ejecutivo de Microsoft

Big Data en el umbral de 2020: las tendencias más frescas

2020 debería ser otro año de rápido crecimiento y evolución para big data, junto con una adopción generalizada de big data por parte de empresas y organizaciones en varios campos. Entonces, resaltemos brevemente las tendencias en big data que deberían jugar un papel importante el próximo año. Java y Big Data: por qué los proyectos de Big Data no pueden prescindir de Java - 3

https://www.arnnet.com.au/slideshow/553034/pictures-our-10-favourite-techie-simpsons-episodes-moments/

Internet de las cosas: el big data es cada vez más grande

El Internet de las cosas (IoT) puede parecer fuera de tema, pero este no es el caso. El IoT continúa en "tendencia" a medida que gana impulso y se extiende por todo el mundo. En consecuencia, el número de dispositivos "inteligentes" instalados en hogares y oficinas también está creciendo. Como debería ser, estos dispositivos envían todo tipo de datos a donde deben ir. Esto significa que el volumen de big data solo crecerá. Según los expertos, muchas organizaciones ya tienen una gran cantidad de datos, principalmente de IoT, que no están bien preparados para usar. En 2020, esta avalancha de datos será aún mayor. En consecuencia, las inversiones en proyectos de big data también aumentarán rápidamente. Y recuerda, el IoT también es muy aficionado a Java . ¿Quién no lo ama?

Gemelos digitales

Los gemelos digitales son otra tendencia interesante que está directamente relacionada con el Internet de las cosas y los grandes datos. En consecuencia, Java verá bastante uso aquí. ¿Qué es un gemelo digital? Esta es una réplica digital de un objeto o sistema real. Un análogo digital de un dispositivo físico hace posible simular los procesos internos, las características técnicas y el comportamiento de un objeto real bajo la influencia de la interferencia y su entorno. Un gemelo digital no puede operar sin una gran cantidad de sensores en el dispositivo real trabajando en paralelo. Para 2020, se espera que a nivel mundial haya más de 20 mil millones de sensores conectados que transmitan información para miles de millones de gemelos digitales. En 2020, esta tendencia debería cobrar impulso y pasar a primer plano.

La transformación digital será más intencional.

Desde hace varios años, la transformación digital se ha mencionado como una tendencia importante. Pero los expertos dicen que muchas empresas y altos directivos tenían una comprensión extremadamente vaga de lo que significa la frase. Para muchos, la transformación digital significó encontrar formas de vender los datos que recopila la empresa para generar nuevas fuentes de ingresos. Para 2020, cada vez más empresas se darán cuenta de que la transformación digital se trata de crear una ventaja competitiva mediante el uso adecuado de los datos en todos los aspectos de su negocio. Esto significa que podemos esperar que las empresas aumenten los presupuestos para proyectos relacionados con el uso correcto e informado de los datos.
"Nos estamos moviendo lentamente hacia una era en la que Big Data es el punto de partida, no el final".
Pearl Zhu ,
autora de la serie de libros Digital Master

Resumen

Big data es otra área de actividad verdaderamente enorme con muchas oportunidades para los desarrolladores de Java. Además del Internet de las cosas, esta área está en auge y sufre una grave escasez de programadores y otros expertos técnicos. ¡Así que ahora es el momento de dejar de leer estos largos artículos y comenzar a aprender Java!
Comentarios
TO VIEW ALL COMMENTS OR TO MAKE A COMMENT,
GO TO FULL VERSION