La importancia del Big Data

user-pic

Los seres humanos creamos y almacenamos información constantemente, y en cantidades exponenciales: información en redes sociales, ubicación geográfica mediante coordenadas GPS, y a través de todas aquellas actividades que la mayoría de nosotros realizamos varias veces al día con nuestros celulares. En el 2012, la cantidad de información almacenada superó los 2.8 zettabytes, y en el 2020 se espera que la cantidad de información sea mucho más grande.

queesbigdataprincipal.gif

En el 2001, el analista Doug Laney de Gartner, utilizaba y definía el término Big Data como: "El conjunto de técnicas y tecnologías para el tratamiento de datos, en entornos de gran volumen, variedad de orígenes y en los que la velocidad de respuesta es crítica".

Con el Internet de las Cosas (Internet Of Things) no solamente somos los seres humanos los que contribuimos a este crecimiento enorme de información. Existe también la comunicación denominada máquina a máquina (M2M machine-to-machine): sensores digitales instalados en contenedores para determinar la ruta generada durante una entrega de algún paquete -y que esta información sea enviada a las compañías de transportación-, sensores en medidores eléctricos para determinar el consumo de energía a intervalos regulares para que sea enviada esta información a las compañías del sector energético, entre otros (2). 

Además, las compañías mantienen grandes cantidades de datos transaccionales como información acerca de sus clientes, proveedores, operaciones, etc. Y tienen enormes bases de datos que contienen datos de censos de población, registros médicos, impuestos, transacciones financieras, entre otros.

Analizaremos, a continuación, las 3Vs del Big Data:

Volumen: crecimiento exponencial de datos que se generan Terabytes de información diaria.

Velocidad y tiempo de respuesta crítico: por ejemplo, el procesamiento en tiempo (casi) real de información del tráfico vehicular para tomar acciones al respecto.

Diferentes formatos y estructuras de los datos: 

  • Orígenes de datos estructurados: bases de datos, hojas de cálculo o ficheros CSV.
  • Orígenes de datos semiestructurados: documentos XML o páginas web.
  • Orígenes de datos no estructurados: documentos de texto, audio, imágenes o vídeo.


La data de las redes sociales plantea un desafío único para el consumo y análisis, especialmente para los que se dedican al marketing, ventas y servicios relacionados..

Data en las redes sociales

CMS Wire reporta que el 90% de data disponible en el mundo ha sido creada en los últimos dos años, y que el 80% de esta data viene de fuentes no estructuradas como las redes sociales (3). La data de las redes sociales plantea un desafío único para el consumo y análisis, especialmente para los que se dedican al marketing, ventas y servicios relacionados.

A modo de ejemplo, en Twitter son cerca de 12 Terabytes de tweets creados diariamente y Facebook almacena alrededor de 100 Petabytes de fotos y videos. Son parte de la información almacenada: las vistas, likes, shares, follows, retweets, comentarios, y descargas. Hoy en día alcanzar un engagement en las redes sociales se hace cada día más difícil, ya que nuestro contenido queda camuflado entra las masivas publicaciones de distintas marcas.

Por ello, el Big Data resulta beneficioso para optimizar las estrategias de las marcasy para estudiar el entorno del cliente, así como su comportamiento y sus necesidades. Hoy en día no podemos perder de vista que estamos rodeados por información que nosotros mismos creamos. 

FUENTES CONSULTADAS:

1. Página web de SAS.

2. Página web de IBM.

3. Página web de CMS Wire.

Auspicios