BIG DATA
Por: Javier Gustavo Pérez Mendieta – Unidad de Investigación y Políticas Municipales
Michael Chen de Oracle (2024) define al Big Data como “conjuntos de datos extremadamente grandes y complejos que no pueden gestionarse ni analizarse fácilmente con las herramientas tradicionales de procesamiento de datos, en particular las hojas de cálculo. Los big data incluyen datos estructurados, como una base de datos de inventario o una lista de transacciones financieras; datos no estructurados, como publicaciones sociales o videos; y conjuntos de datos mixtos, como los que se utilizan para entrenar grandes modelos de lenguaje para la IA (Inteligencia Artificial)”.
Google (s/f) señala que el Big Data “engloba conjuntos extremadamente grandes y diversos de datos estructurados, sin estructurar y semiestructurados que siguen creciendo exponencialmente a lo largo del tiempo. Estos conjuntos de datos son tan enormes y complejos en volumen, velocidad y variedad que los sistemas de gestión de datos tradicionales no pueden almacenarlos, procesarlos ni analizarlos”.
Para Intel (s/f) “describe el flujo de datos no estructurados creados por todo, desde las publicaciones en redes sociales y el tráfico de red hasta el Internet de las Cosas (IoT), las cámaras de seguridad públicas y los datos meteorológicos globales. A diferencia de los small data, que se pueden estructurar, almacenar y analizar en una base de datos relacional, los big data superan la capacidad de las tablas, filas y columnas en complejidad y procesamiento”.
Badman y Kosinski de IBM (2024) señalan que “se refiere a conjuntos de datos masivos y complejos que los sistemas tradicionales de gestión de datos no pueden manejar. Cuando se recopilan, gestionan y analizan adecuadamente, los big data pueden ayudar a las organizaciones a descubrir nuevos insights y tomar mejores decisiones empresariales”.
En síntesis, Big Data hace referencia a conjuntos de datos, estructurados y no estructurados, extremadamente grandes y de elevada complejidad recabados de fuentes diversas y que permiten mediante su procesamiento una mejora toma de decisiones.
Google (s/f) afirma que las definiciones de Big Data pueden variar, sin embargo, existe cierto consenso en las V del Big Data, inicialmente 3 a las que se agregó otras 3:
“Volumen. Como su nombre indica, la característica más común asociada al Big Data es su gran volumen. Esto describe la enorme cantidad de datos que se pueden recopilar y que se generan a partir de diversas fuentes y dispositivos de forma continua.
Velocidad. La velocidad de Big Data hace referencia a la velocidad a la que se generan los datos. Hoy en día, los datos se suelen generar en tiempo real o casi en tiempo real y, por lo tanto, también deben procesarse, consultarse y analizarse al mismo ritmo para tener un impacto significativo.
Variedad. Los datos son heterogéneos, es decir, pueden proceder de muchas fuentes diferentes y pueden estar estructurados, no estructurados o semiestructurados. Los datos estructurados más tradicionales (como los datos de hojas de cálculo o bases de datos relacionales) se complementan ahora con texto, imágenes, audio y archivos de vídeo no estructurados, o con formatos semiestructurados como los datos de sensores que no se pueden organizar en un esquema de datos fijo.
Veracidad. El Big Data puede resultar desordenado, con mucho ruido y es propenso a errores, lo que dificulta el control de la calidad y la precisión de los datos. Los conjuntos de datos grandes pueden resultar difíciles de manejar y confusos, mientras que los conjuntos más pequeños pueden presentar una imagen incompleta. Cuanto mayor sea la veracidad de los datos, más fiable será.
Variabilidad. El significado de los datos recogidos cambia constantemente, lo que puede provocar incoherencias a lo largo del tiempo. Estos cambios incluyen no solo los cambios de contexto y de interpretación, sino también en los métodos de recogida de datos basados en la información que las empresas quieren recoger y analizar.
Valor. Es fundamental determinar el valor empresarial de los datos que recoges. Los Big Data deben contener los datos adecuados y luego analizarse de manera eficaz para extraer información valiosa que ayude a tomar decisiones fundamentadas”.
Referencias bibliográficas
Chen, Michael (23 de septiembre de 2024). ¿Qué es el big data? https://www.oracle.com/es/big-data/what-is-big-data/
Google (s/f). ¿Qué es Big Data? https://cloud.google.com/learn/what-is-big-data?hl=es
Intel (s/f). ¿Qué es Big Data? https://www.intel.la/content/www/xl/es/artificial-intelligence/analytics/what-is-big-data.html
Badman, Annie y Kosinski, Matthew (18 de noviembre de 2024). ¿Qué es el big data? https://www.ibm.com/mx-es/think/topics/big-data
Las opiniones expresadas en este documento son de exclusiva responsabilidad de los autores y no reflejan necesariamente una posición del Gobierno Autónomo Municipal de La Paz.
¿Qué tan útil fue esta publicación?
¡Haz clic en una estrella para calificarla!
Puntuación media 0 / 5. Recuento de votos: 0
No hay votos hasta ahora! Sea el primero en calificar esta publicación.