ORLANDO RODRIGUEZ
Cuatro métodos para la toma de decisiones en la Ciencia de Datos.
La Ciencia de Datos es la herramienta que incorpora el conocimiento moderno y la complejidad de las técnicas especializadas para enfrentar la incertidumbre en la dinámica de la economía global. La Ciencia de Datos facilita la toma racional de decisiones en contextos corporativos.
La historia del conocimiento es el relato de cómo la humanidad intenta abrirse paso en medio de la incertidumbre. Este desafío es una de las principales herencias que la Filosofía entregó a la Ciencia. René Descartes con el Discurso del Método y Francis Bacon con el Novum organum trazaron sus propios caminos para llegar a la toma de decisiones. Sus aportes fundaron las bases del método científico desde las tradiciones racional y empírica.
La Ciencia de Datos lleva hoy la antorcha y ha trazado caminos hasta la frontera del conocimiento contemporáneo. Aquí describimos algunos de los métodos más recomendados para resolver problemas en las empresas a través de la Ciencia de Datos: Crisp-DM, Ppdac, Smart and Data Analytics Lifecycle.
Figura 1. CRISP-DM.

El proceso estándar intersectorial para la minería de datos (Crisp-DM) sigue seis pasos: 1) La Comprensión Empresarial, enfocada en la delimitación del problema y la lectura del contexto. Esta fase proporciona los objetivos y los requisitos para la tarea. 2) La Comprensión de Datos incluye la recopilación de datos, la descripción de datos y la verificación de la calidad de los datos. 3) La Preparación de Datos afina los datos para trabajar. Esta fase se basa en la limpieza de datos, la construcción de datos y el formato de los datos. 4) El Modelado selecciona la técnica del modelo, el diseño del modelo y la definición del modelo. 5) La Evaluación del Modelo compara el desempeño de las alternativas del modelo, revisa el proceso y define el paso a seguir frente al problema. 6) El Despliegue comunica los resultados al usuario para pasar del diseño a la toma efectiva de decisiones, de manera que el proceso sea útil.
Figura 2. Data Problem Solving Cycle: Problem, Plan, Data, Analysis, Conclusión (Ppdac).

Un segundo método es el Data Problem Solving Cycle: Problem, Plan, Data, Analysis, Conclusión (Ppdac). En primer lugar, se delimita cuál es el problema a resolver. Allí se identifican las variables o categorías de análisis. Luego, se diseña el plan. Se evalúa el acceso, el volumen y la calidad de los datos. El tercer paso es recolectar los datos y almacenarlos de manera lógica, según el plan. La cuarta fase es el modelaje a partir de la interacción de los datos a través de las categorías o variables seleccionadas. Por último, se sintetizan y comunican los resultados de manera que sean accesibles para el público objetivo.
Figura 3. Star with the Strategy, Metrics and Data, Applied Analytics, Report Results, and Transform Business (SMART).

El tercer camino es Star with the Strategy, Metrics and Data, Apply Analytics, Report Results, and Transform Business (SMART). El punto de partida hace énfasis en que, en lugar de ir directo a los datos, primero se debe conocer el negocio y comprender cuál es la estrategia que se quiere aplicar. Allí se definen los objetivos de la decisión que deben corresponder al logro de la visión corporativa. Luego sí se pasa a la medición de los datos en función de tener criterios para cumplir la estrategia. La tercera fase es la aplicación de la analítica. Los datos son procesados e interconectados, descubriendo información de valor para alcanzar el objetivo. En cuarto lugar, los hallazgos principales son reportados al tomador de decisiones de manera que sean fáciles de comprender. Por último, la aplicación de los resultados debe ser significativa para transformar el negocio, que es la verdadera utilidad de la Ciencia de Datos.
Figura 4. Data Analytics Lifecycle.

Data Analytics Lifecycle es una cuarta opción. La primera fase es el Descubrimiento del propósito del negocio para moldear los datos. En segundo lugar, se realiza la Preparación y Procesamiento de datos a partir de los requerimientos del negocio. Luego se Planifica el modelo en función de las características del negocio. La cuarta fase es la Construcción del modelo para encontrar respuestas a los requerimientos definidos. El siguiente paso es la Comunicación de los resultados a través del uso de narrativas que permitan retroalimentar a los públicos de interés con la información de valor obtenida. Al final, se llevan los datos al escenario práctico del negocio para Operacionalizar y Medir la Efectividad del modelo en el contexto real.
Los cuatro métodos referencian los caminos trazados por Descartes y Bacon. El método científico se operacionaliza en el escenario corporativo para facilitar la transferencia de conocimiento y la toma de decisiones. La Ciencia de Datos genera una transformación significativa hacia la creación de valor y la rentabilidad en las empresas.
Los cuatro métodos señalan que los puntos claves para garantizar la utilidad de la Ciencia de Datos están en la comprensión del negocio y la toma de decisiones para realizar una transformación significativa de la empresa. Identificar la visión corporativa y el problema del negocio señala de qué manera se deben operacionalizar los datos y diseñar el modelo. Por lo tanto, la técnica operativa carece de utilidad al usar las aplicaciones y paquetes de softwares sin la visión estratégica sobre la gestión del negocio. La planeación empresarial alimentada por el diseño de modelos y la analítica de datos propicia la transferencia de conocimiento para la toma de decisiones asertivas y la ejecución de tácticas hacia su transformación permanente.
Referencias sugeridas
Lu, J. (2022) Data science in the business environment: Insight management for an Executive MBA. The International Journal of Management Education, 20.
Marchionini, G. (2023) Information and data sciences: contexts, units of analysis, meaning and human impact. Data and Information Management, 1
Martinez, I.; Viles, E & Olaizola, I. (2021) Data Science methodologies: current challenges and future approaches. Big Data Research.