Es la interrogante que muchos se hacen y por lo cual el especialista de la UNI, Juan Carlos Canchano, lo manifiesta de manera clara y simple para aquellos que al escuchar sobre Big Data, aún tienen algún grado de confusión. Y es así que, precisamente y en principio, nuestro invitado nos señala que Big Data básicamente se refiere al hecho de que ahora podemos recopilar y analizar datos de formas que eran simplemente imposibles incluso hace unos años.
¿Qué es Big Data y por qué está liderando en las tendencias actuales?
Dentro de apenas tres años, tendremos más de 50 mil millones de dispositivos que están conectados a Internet y todos ellos con información a tratar, dice el especialista.
(americasistemas.com.pe. Lima, Perú – 10 de noviembre 2021) Así también, según Gartner, “Big Data constituye un volumen elevado de datos, alta velocidad y gran variedad de activos de información que demandan formas rentables e innovadoras de procesamiento de la información que permiten un mejor conocimiento, toma de decisiones y automatización de procesos”.
Hay dos cosas que están impulsando este movimiento de Big Data: Primero, el hecho de que se tienen más datos sobre múltiples temas y segundo nuestra capacidad mejorada para almacenar y analizar cualquier dato. El Big Data es un área de investigación potencial que recibe una atención considerable por parte del mundo académico y las comunidades de TI. En el mundo digital, las cantidades de datos generados y almacenados se han expandido en un corto período de tiempo. En consecuencia, esta tasa de datos en rápido crecimiento ha creado muchas oportunidades. Todo lo que hacemos en nuestro mundo cada vez más digitalizado deja un dato, esto significa que la cantidad de datos disponibles está literalmente creciendo exponencialmente en cada momento. Hemos creado más datos en los últimos dos años que en toda la historia previa de la humanidad, ya que durante la pandemia la comunicación virtual y el trabajo remoto han ocasionado que los medios digitales sean utilizados explosivamente, generándose por estos medios; Datos de voz, de gráficos, de noticias, de comunicación, de dispositivos conectados entre sí, entre muchas más interacciones que generan datos día a día.
Para el 2025, se predice que aproximadamente se crearán 1,7 megabytes de datos nuevos cada segundo, por cada ser humano en el planeta. Estos datos provienen no solo de las decenas de millones de mensajes y correos electrónicos que nos enviamos cada segundo por correo electrónico y por redes sociales, también provienen del billón de fotos digitales que tomamos cada año y las cantidades crecientes de datos de video que generamos (cada minuto que se cargan actualmente miles de horas de videos nuevos en redes como YouTube y Facebook).
Tradicionalmente los datos almacenados eran datos estructurados, administrados por bases de datos relacionales. Estos datos estructurados como su nombre indica se diferenciaban por tener una estructura fija como: Nombre del cliente, dirección, teléfono, entre otros. Pero esto ha cambiado drásticamente, ya que las tendencias tecnológicas mencionadas anteriormente han generado otra multitud de datos como comentarios de Facebook, fotos a través del móvil, etc. Que distan mucho de ser estructurados. Además de eso, tenemos datos de todos los sensores que ahora nos rodean. Los últimos smartphones que se tienen poseen GPS para saber dónde estamos, qué tan rápido nos estamos moviendo (acelerómetro), cómo es el clima a nuestro alrededor, qué fuerza estamos usando para presionar la pantalla táctil (sensor táctil) y mucho más.
Para el 2025, tendremos más de ocho mil millones de teléfonos inteligentes. en el mundo, todos llenos de sensores que recopilan datos. Pero no solo nuestros teléfonos se están volviendo cada vez más inteligentes, ahora tenemos televisores inteligentes, relojes inteligentes, medidores inteligentes, hervidores inteligentes, e incluso balanzas inteligentes. De hecho, para el 2025, tendremos más de 50 mil millones de dispositivos que están conectados a Internet. Todo esto significa que la cantidad de datos y la variedad de datos (desde datos de sensores hasta textos y videos) en el mundo crecerá a niveles inimaginables.
En resumen, puede decirse que los detonantes para que el Big Data se encuentre en auge son:
– El actual estado de la economía y el entorno competitivo demandan soluciones que permitan a los directivos tomas de decisiones ágiles y precisas.
– La variedad actual de las fuentes de datos como: audio, video, redes sociales, sensores, entre otros.
– El abaratamiento del hardware y en particular de las computadoras más avanzadas propician la analítica.
– Nuevas soluciones de almacenamiento y computación distribuida (Cloud Computing).
– Habilitación de las bases de datos por columnas y no relacionales (NoSQL), que permiten gestionar de forma ágil cualquier tipo de información, no solo estructurada.
Who is who: Juan Carlos Canchano Vizcarra, autor del presente artículo es especialista en Ciencia de Datos de las canteras de la Escuela de Ingeniería de Sistemas de la UNI y también miembro del PMI Lima Perú Chapter con certificaciones en Ciencia de Datos, Analítica de datos y en Dirección de Proyectos.