Columnas
Continuando con este tema relacionado con los datos, que muchos, por su importancia, dicen son actualmente el nuevo petróleo, ya que se han convertido en el insumo esencial en esta Era tecnológica de la vida humana. Lo cierto es que, muchos que en algún momento pensábamos que esa idea era exagerada, poco a poco nos estamos convenciendo de ello, debido a que su característica exponencial es muy fuerte e incidente en los diferentes ámbitos de desempeño.
En abono de lo anterior, hoy se dice que el verdadero despunte de la Era de los datos apenas está iniciando este año, pero su relevancia y notoriedad cada día tomará mayor fuerza, derivado de que su inmersión ha alcanzado el terreno de la toma de decisiones tanto en el entorno social, empresarial y de una gran cifra de organizaciones.
Tomando en cuenta lo ya mencionado, debemos tener muy claro que la gestión de los datos juega un rol básico, por lo que si se operan de manera correcta, por supuesto que se obtendrán tremendas ventajas; sin embargo, también debemos tener presente el reverso de la moneda, es decir, si el cometido se distorsiona hacia un mal uso, tengamos la plena seguridad que transitaremos caminos riesgosos para la humanidad. Pero bueno, valga lo comentado en las líneas que anteceden para tener presentes los riesgos y desafíos que afrontamos.
En la entrega anterior, hablamos de manera amplia de una etapa del Círculo de la Data relativa a la Analítica de Datos o Big Data y decíamos que representó un gran salto en el ordenamiento, uso y aplicación de grandes volúmenes de datos.
No obstante, también debemos destacar que de forma casi paralela surgió una ciencia encargada del estudio de datos, que tiene como fin extraer información explotable a partir de datos brutos y a la que se conoce como Data Science o Ciencia de Datos, para ir más a fondo en ella, es menester enfatizar que opera en un campo multidisciplinario con el objetivo principal de identificar tendencias, conceptos, motivos, prácticas, conexiones y correlaciones en magnas cadenas de datos.
De tal forma que, debido a que los datos se multiplican día con día en esta era digital; Big Data y Data Science se han convertido en términos propagados en todo el mundo, pero continuamente se incurre en el error de utilizarlos indistintamente, lo que provoca confusión; debido a que si bien es cierto ambas disciplinas están íntimamente relacionadas, tienen similitudes y son complementarias, también lo es que encarnan aspectos diferentes de la gestión y el examen de datos en el mundo actual.
Por un lado, el Big Data está referido a la enorme cantidad de datos que se generan en la actualidad, proviniendo de varias fuentes, como redes sociales, transacciones en línea, sensores, dispositivos móviles, entre otros y se caracterizan, como ya dijimos, por volumen, variedad y velocidad; mientras que la Data Science está referida a la disciplina que se encarga de extraer conocimiento y comprensión a partir de los datos; en un espacio multidisciplinario con combinaciones de habilidades de programación, matemáticas, estadísticas y conocimiento del dominio para descubrir patrones, tendencias y conocimientos ocultos de los datos.
Establecido lo anterior, debo comentar que los Científicos de esta materia asumen responsabilidades de obtención de datos de diferentes fuentes, incluyendo las bases de datos de Big Data, a esto se le conoce como recopilación de datos.
De igual forma y debido a que los datos regularmente están desordenados, éstos especialistas invierten cantidades importantes de tiempo a la limpieza y preparación, para en un siguiente paso, mediante el uso de técnicas estadísticas y herramientas de análisis explorar los datos para ubicar patrones, tendencias y relaciones, a través de técnicas de aprendizaje automático o Machine Learning y minería de datos, posteriormente efectúan un modelado predictivo, los Científicos de Datos, crean modelos predictivos que posibilitan pronosticar futuros o tendencias basadas en datos históricos y; finalmente, transmiten sus hallazgos por medio de visualizaciones efectivas que permitan a los no expertos comprender los resultados.
Como ustedes percibirán con esta Ciencia de Datos hemos entrado, dentro del Círculo de la Data, a un terreno nuevo en el que ya nos topamos con algunas tecnologías exponenciales que están marcando actualmente el rumbo tecnológico, tales como Machine Learning, Deep Learning, AI y Data Learning, mismas que tienen las capacidades para procesar y gestionar volumen, variedad, velocidad y veracidad de creación de datos actuales.
Para efecto de mayor comprensión de algunos conceptos mencionados en el párrafo anterior, haré alusión a unas definiciones sencillas como Machine Learning o Aprendizaje Automático: referida esta a una rama de la Inteligencia Artificial, que a partir de algoritmos matemáticos, logra que las máquinas aprendan de forma similar a como lo hacemos los humanos y realicen análisis sin que hayan sido explícitamente programadas para ello.
Deep Learning: Es un método de la Inteligencia Artificial (IA) que enseña a las computadoras a procesar datos de una manera que se inspira en el cerebro humano, ejemplos: asistentes virtuales como Siri, Alexa y Cortana.
Inteligencia Artificial (IA): Está referida a sistemas informáticos que buscan imitar la función cognitiva humana a través de máquinas, procesadores y softwares con el objetivo de realizar tareas de procesamiento y análisis de datos.
Data Learning: Es una rama de la Inteligencia Artificial basada en la idea de que los sistemas pueden aprender datos, identificar patrones y tomar decisiones con mínima intervención humana.
Un aspecto clave para entender todo este nuevo entramado basado en los datos, es captar que la explotación de éstos deberá estar alineada en este proceso por medio de nuevos paradigmas, en los que los reportes dejen su carácter analítico y pasen a ser predictivos.
La siguiente semana concluiremos con este tema…….saludos.