Compártelo:

¿Cómo Cómo?, ¿Big Data?, ¿Análisis de datos?… ¿Qué es eso? Son algunas de las principales preguntas que recibo al explicar que voy a hacer el próximo año, tras haber finalizado el grado universitario y comentar que voy a realizar un Máster de Big Data deportivo.

Pero todo no queda ahí, porque ya si digo Big Data deportivo, las muecas son mayores;

¿Cómo que el deporte según números? Eso yo también se hacerlo, el que más corre es el mejor, el que más goles mete es mejor goleador… o por otra parte están quienes dicen ¿Qué pasa miraste ayer la película de Moneyball (Rompiendo las reglas) y quieres hacer lo mismo?

Porque seamos sinceros, todos hemos escuchado hablar del Big Data, pero pocas personas conocen y nos podrían explicar claramente que es el Big Data, es por ello que voy a intentar esclarecer esas dudas, y me comprometo dentro de un año, volver a este post para editarlo y hacerlo de mayor calidad, con los conocimientos que haya adquirido en este periodo.

Así que vamos a intentar ejemplificarlo, y que sea para todos fácil de entender con casos que todos podamos comprender.

El Big Data es el conjunto de tecnologías y prácticas que permiten almacenar, tratar y analizar cantidades de datos tan grandes y complejos de gestionar que resulta imposible procesarlos empleando aplicaciones tradicionales de administración de bases de datos.

Todo ello resumiendo sus características en las 3V, en las 5V o las 7V;

  • V de volumen.
  • V de velocidad.
  • V de variedad.
  • V de veracidad.
  • V de valor.
  • V de viabilidad
  • V de visualización

Más adelante explicaremos que significan cada una de estas características. Pero ahora puede surgir la pregunta, ¿Qué significa realmente en la definición “es grande” ?, ya que puede variar según la empresa o el conjunto de datos, por ejemplo, una empresa como FedEx genera terabytes de datos al día, mientras que para una pequeña empresa puede generar 2 gigabytes, y grandes compañías como Google, por ejemplo, suelen hablar de Petabytes y Exabytes de información.

Para una empresa pasar de 2Gb de datos diarios a 300Gb, puede verlo como una cantidad muy grande de datos y que necesita nuevas técnicas para poder extraer el máximo de información de esos datos, así que debemos tener claro que toda base de datos, sin importar su tamaño, sirve para analizar y extraer información. Además, como veremos más adelante, no solo de una base de datos se puede extraer información, sino también de otros elementos como las interacciones en las redes sociales o videos.

Bien, puede que tras leer esto, digas esto no va conmigo, eso en mi empresa no se hace o ¿Cómo que generar datos?

Si amigos, así es… toda empresa desde la más grande del mundo, hasta la pequeña tienda que hay en la esquina de tu casa puede recopilar datos y hacer un análisis de los mismos, porque lo que no se mide no se puede mejorar, si eres una pyme es hora que empieces a tomar en serio este concepto y crear un plan de acción para su implementación.

Big data en números

Llegados a este punto, puede que digas vale, genial todo lo que me cuentas, y lo que se puede lograr con el Big Data, pero las pymes pueden llegar a verse sobrepasadas con ellos, ya que no disponen de las herramientas necesarias para obtener y organizar esa enorme cantidad de datos.

Eso es cierto y por ello, los gurús acuñaron el termino Small Data, ya que el concepto de las 5V’s cabe perfectamente para una pyme, lo único que cambia es el volumen de datos y las herramientas que utilizaremos en el proceso.

Big Data en números

Cada día se generan mundialmente en torno a 8 millones de terabytes de datos, esta información proviene de infinidad de fuentes: mensajes enviados, videos compartidos, señales GPS, transacciones online etc…

Porque vivimos en un mundo en el que se genera una cantidad ingente de datos. Según Gartner, el 90% de los datos de la historia de la humanidad ha sido generado en los últimos 5 años. Y el 80% de ellos, desestructurados.

Surge entonces, una necesidad de tratar todos estos datos para obtener información y poder tomar decisiones informadas con mayor facilidad gracias a estos.

Por ejemplo, actualmente se genera en un minuto en el mundo tanta información como desde los inicios de los tiempos hasta el año 2000. Sólo en Facebook, cada día se mandan 10.000 millones de mensajes, hay 4.500 millones de clics en el botón de “Me gusta” y 350 millones de fotos nuevas subidas diariamente

Pese a la pandemia mundial del año 2020, se calcula que se crearán en torno a 40 Zettabytes de información mundialmente, incrementando en 300 veces lo que se generaba en el año 2005, ya que se calcula que más de 6000 millones de personas tienen dispositivos móviles propios.

Características del Big Data

Como hemos indicado, la cantidad de características importantes varía según la fuente en la que se consulte.

Volumen:

El volumen se refiere a la cantidad de datos que son generados cada segundo, minuto, día… Ya que hace referencia a las cantidades masivas de datos, es la característica más asociada al Big Data.

Por ejemplo, a un e-commerce, le convendría implantar tecnología Big Data para procesar la información que recoge su página web rastreando todas las acciones que lleva a cabo el cliente; conocer donde cliquea más veces, cuántas veces ha pasado por el carrito de la compra, cuáles son los productos más vistos, las páginas más visitadas…

Pero también le valdría llevar a cabo Smart data, con herramientas como Google Analytics y Hotjar.

Velocidad:

Cuando hablamos de velocidad nos referimos a la rapidez en la que son creados, almacenados y procesados en tiempo real, aunque actualmente muchas veces el análisis tiene sentido si los datos están captados y tratados en tiempo real sin necesidad de almacenarlos previamente en una base de datos.

Para los procesos en los que el tiempo resulta fundamental, tales como la detección de fraude en una transacción bancaria o la monitorización de un evento en redes sociales, estos tipos de datos deben estudiarse en tiempo real para que resulten útiles para el negocio y se consigan conclusiones efectivas.

Por ejemplo, la Bolsa de Nueva York captura 1 Terabyte de información sobre operaciones bursátiles durante cada sesión, y los coches modernos tienen más de 100 sensores capaces de monitorizar muchas cosas para ayudarnos en la conducción

Variedad:

La variedad se refiere a las formas, tipos y fuentes en las que se registran los datos, porque como hemos dicho anteriormente, en el apartado de Big Data en números, los datos que generamos provienen de una gran multitud de fuentes, pudiendo ser datos estructurados, como son las bases de datos, o datos no estructurados, como serían los datos de sensores, los artículos que leemos en blogs, las secuencias de click que hacemos en una misma página, e infinidad de acciones más que realizamos desde nuestro Smartphone, Tablet y ordenador.

Por ejemplo, cada mes se ven más de 4.000 millones de horas de vídeo en Youtube, y en Twitter los más de 200 millones de usuarios activos al mes, hacen que cada día se envían cerca de 400 millones de Tweets.

A estos 3 V iniciales se han añadido 2 características más para formar las 5V:

Veracidad:

Al hablar de veracidad nos referimos al grado de fiabilidad de la información recibida.

La necesidad de explorar y planificar para minimizar la incertidumbre es un reto para el Big Data que está a la orden del día en las compañías dedicadas al análisis de datos, es por ello necesario invertir tiempo para conseguir datos de calidad, aplicando soluciones y métodos que puedan eliminar datos imprevisibles.

Por ejemplo, según indican algunos estudios de universidades estadounidenses los datos de baja calidad le cuestan a la economía de USA alrededor de 3100 millones de dólares anualmente.

Valor:

En algunos casos, esta es la característica más difícil de entender, ya que el dato no es valor, el mero hecho de recopilar gran cantidad de información tampoco tienes valor.

El valor se obtiene de datos que se transforman en información; esta a su vez se convierte en conocimiento, y este en acción o en decisión. El valor de los datos está en el beneficio que una empresa puede sacar de los datos con el uso del Big Data.

Por ejemplo, una publicación en una red social, que, gracias al uso de tecnologías de procesamiento de lenguaje natural, puede medir el sentimiento positivo o negativo, con la ayuda de un algoritmo de análisis de redes sociales o herramientas que permitan obtener de esta información.

Viabilidad:

La viabilidad se trata de la capacidad que tienen las compañías en generar un uso eficaz de los datos que manejan.

La inteligencia competitiva también se asocia con la innovación de los equipos de trabajo y el uso de tecnologías empleadas, es por ello que una “empresa inteligente” analiza, selecciona y monitoriza la información con el fin de conocer mejor el mercado en el que opera, a sus clientes y diseñar estrategias eficaces.

 

El secreto del éxito es descubrir las relaciones entre las variables ocultas. #Bigdata

Una vez que conoces la viabilidad de tu organización, es el momento de detallar el proyecto en una hoja de ruta, y desarrollar el plan de negocio.

Visualización

Cuando hablamos de visualización nos referimos al modo en el que los datos son presentados. Una vez que los datos son procesados (los datos están en tablas y hojas de cálculo), necesitamos representarlos visualmente de manera que sean legibles y accesibles, para encontrar patrones y claves ocultas en el tema a investigar.

Y los tipos de datos también lo son:

  • Tipos de datos no estructurados o desestructurados: documentos, vídeos, audios…
  • Tipos de datos semi-estructurados: software, hojas de cálculo, informes.
  • Tipos de datos estructurados: bases de datos

Cabe recordar que tan solo el 20% de los datos que se crean, son estructurados.

¿Para qué sirve el Big Data?

Puede que digas vale, vale, muy interesante todo eso que me cuentas, hemos escuchado que tiene aplicación en todo tipo de sectores como la medicina, la bolsa, en el comercio electrónico, en la política… pero ¿Para qué sirve realmente el Big Data?

Lo que hace que el Big Data sea tan útil para muchas empresas es el hecho de proporcionar respuestas a muchas preguntas que las empresas ni siquiera sabían que tenían, al proporcionarles un punto de referencia, ya que, al disponer de una cantidad tan grande de información, los datos pueden ser moldeados o probados de cualquier manera que la empresa considere adecuada, consiguiendo identificar los problemas de una forma más comprensible o verlos desde otros ángulos, de forma mucho más rápida, sin que ello les produzca nuevos problemas y de manera eficiente.

Cabe marcar que también les permite eliminar las áreas problemáticas antes que los problemas acaben con sus beneficios o su reputación.

El análisis de Big Data ayuda a las empresas a aprovechar mejor sus datos y utilizarlos para identificar nuevas oportunidades, a su vez, operaciones más eficientes, con negocios más inteligentes, mayores ganancias y clientes más felices y con más alta satisfacción.

Todo ello, producido porque mediante el Big Data dichas empresas consiguen valor de las siguientes formas:

  • Reducción de coste
  • Toma de decisiones más rápida y mejor
  • Nuevos productos y servicios

Ahora, pasemos a ver los usos del Big Data con algunos ejemplos según el tipo de empresa, pero no olvidemos que estos son solo algunos de los muchos usos que se le pueden dar al análisis de datos.

  • Turismo: Mantener felices a los clientes y con un alto grado de satisfacción, es clave para la industria del turismo, pero muchas veces puede ser difícil de medir, especialmente en el momento pertinente.
    • Los hoteles y casinos, por ejemplo, sólo tienen una pequeña oportunidad de dar la vuelta a una mala experiencia de cliente, antes de poder perderlo por siempre, en estos casos el análisis de datos ofrece la capacidad de recopilar datos de los clientes, aplicar análisis e identificar inmediatamente posibles problemas antes que sea demasiado tarde.
  • Salud: El Big Data aparece en grandes cantidades en la industria sanitaria, por no decir, en prácticamente toda, mediante los registros de pacientes, planes de salud, información de seguros…, pero todo esto en muchos casos pueden ser difíciles de manejar, pero todos estos registros están llenos de información clave una vez que se aplican las analíticas correctas. Es por eso que la tecnología Big Data es tan importante para el cuidado de la salud, ya que al analizar grandes cantidades de información – tanto estructurada como no estructurada – rápidamente, se pueden proporcionar diagnósticos u opciones de tratamiento casi de inmediato.
    • Este es nuevo mundo que se está abriendo tanto en el ámbito de la sanidad como en el legal o judicial, ya que se está empezando a analizar la posibilidad de ser una máquina quien efectúe, es decir que sea un ordenador quien diagnostique a los pacientes o quien juzgue a los acusados, debido a que su reflexión no estaría sesgada por la persona que tiene enfrente, podría estar trabajando continuamente sin necesidad de parar a descansar y con una mayor velocidad de dar respuestas.
      • Cabe destacar, que esto, aún se está teorizando y ha abierto un gran debate en torno a ello. No dudes en poner tu opinión sobre el tema en los cometarios
  • Administración tanto pública como privada: Se encuentra ante el desafío de mantener la calidad y productividad de sus servicios con unos presupuestos ajustados, la tecnología les agiliza las operaciones mientras que da a la administración una visión más holística de la actividad.
  • Comercio minorista, o lo que es lo mismo, la tienda de la esquina: El servicio al cliente ha evolucionado en los últimos años, ya que los compradores más inteligentes esperan que los minoristas comprendan exactamente lo que necesitan, cuando lo necesitan y aquí es donde entra el Big Data, ya que ayuda a los minoristas a satisfacer esas demandas.
    • Con cantidades de datos de programas de fidelización de clientes, hábitos de compra y otras muchas fuentes, los minoristas no sólo tienen una comprensión profunda de sus clientes, sino que también pueden predecir tendencias, recomendar nuevos productos y aumentar la rentabilidad de su negocio, tanto a pie de calle como online.
  • Publicidad: La proliferación de teléfonos inteligentes y otros dispositivos GPS ofrece a los anunciantes la oportunidad de dirigirse a los consumidores cuando están cerca de una tienda, una cafetería o un restaurante, produciendo que se abran nuevos ingresos para los proveedores de servicios y ofrece a muchas empresas la oportunidad de conseguir nuevos anuncios.

Cabe recordar, que estos son solo el ejemplo de algunos de los muchos usos que se puede dar al análisis de datos dentro de una empresa.

Si he conseguido que llegues hasta aquí, espero poderte haber explicado Xsobre que se trata el análisis de datos y agradecería que dejases tu opinión o tus conocimientos en los comentarios, para que así tanto los otros lectores como yo, podamos aprender sobre este gran y amplio mundo que es el Big Data.

Si he conseguido que llegues hasta aquí, espero poderte haber explicado y hacer que entiendas mejor que es el análisis de datos y agradecería que dejases tu opinión o tus conocimientos en los comentarios, para que así tanto los otros lectores como yo, podamos aprender sobre este gran y amplio mundo que es el Big Data.

Compártelo:

Deja un comentario