Democratización de los datos para usuarios de distintos niveles de conocimientos y competencias
Si eres ingeniero de datos o arquitecto de datos, probablemente te quedes despierto por las noches preguntándote cómo diseñar tus plataformas de integración, gestión y análisis de datos, de modo que tus compañeros de administración de bases de datos (DBA) y operaciones de TI puedan gestionarlas fácilmente, mientras que un conjunto variado de usuarios de datos pueda acceder a ellas simultáneamente. Estos usuarios van desde usuarios nuevos, exigentes y prácticos, como desarrolladores y científicos de datos, hasta aquellos que tradicionalmente utilizan los datos a través de SQL y consultas ad hoc, como los analistas de negocios, así como aquellos que interactúan con los datos de forma indirecta a través de aplicaciones de negocio.
No todo el mundo en tu empresa es científico de datos y, dada su escasez, tu empresa sería bastante pequeña si ellos constituyeran la mayoría de la plantilla. A riesgo de generalizar en exceso el papel de los científicos de datos, estos suelen necesitar datos que respalden el diseño y el entrenamiento de algoritmos que puedan implementarse en fases posteriores, integrarse en otras aplicaciones y ser utilizados por otros usuarios. Los científicos de datos suelen necesitar conjuntos de datos grandes y variados, pero rara vez es necesario que sean en tiempo real; sin embargo, la actualidad es un requisito fundamental, ya que repiten el entrenamiento heurístico de sus modelos.
Los desarrolladores de aplicaciones, al igual que los científicos de datos, suelen interactuar con sus datos a través de API de programación. Los conjuntos de datos con los que trabajan suelen ser más pequeños, o bien series temporales y en tiempo real, integrados directamente en el proceso empresarial en lugar de servir de base para este, como suele ocurrir en el caso de los científicos de datos. En el caso de los analistas de negocio, las necesidades son, una vez más, diferentes, y para los usuarios finales, el objetivo es hacer que los datos sean invisibles para sus operaciones, incluso si son parte integral y esencial de dichas operaciones. La cuestión aquí es que los diseñadores de sistemas de datos deben ser capaces de poner los datos a disposición de varios grupos diferentes que no comparten los mismos conjuntos de habilidades, funciones y responsabilidades, ni los mismos niveles de interés en lo que respecta a los datos.
¿Qué implicaciones tiene esto para los ingenieros de datos o los arquitectos de datos? Es sencillo: hacer que los datos sean accesibles para personas con distintos niveles de conocimientos, de modo que puedan obtener lo que necesitan, cuando lo necesitan y de la forma que les resulte más útil. Bueno, quizá no sea tan sencillo. ¿Cómo se evitan los conjuntos de datos aislados, gestionados por sistemas a medida, si se atiende de forma específica a cada uno de estos grupos?
Conoce a tu comunidad de usuarios y cómo utilizan los datos
Cada persona de su empresa tiene unas necesidades específicas en materia de datos, tanto en lo que respecta al tipo de datos y las herramientas que necesita utilizar como a la forma en que se considera eficaz el uso de dichos datos. Es posible que algunos usuarios necesiten acceder a un conjunto de datos muy concreto para realizar una tarea específica, mientras que otros pueden necesitar datos generales para la planificación y la toma de decisiones estratégicas, por ejemplo. Algunos de sus usuarios necesitarán datos brutos detallados, mientras que otros necesitarán paneles de control, informes y visualizaciones seleccionados. En muchos casos, el mismo usuario puede encajar en cada uno de los escenarios anteriores, pero durante diferentes fases de un proyecto. En otros casos, estos diferentes escenarios aprovechan los mismos datos en diferentes formas o manipulados de diferentes maneras y en combinación con otros conjuntos de datos.
Para saber cómo facilitar el trabajo a los usuarios de datos, es necesario comprender el nivel de conocimientos de los usuarios, así como las herramientas y los conjuntos de datos que necesitarán. Por ejemplo, además de los conjuntos de datos mencionados anteriormente, los científicos de datos suelen dedicar mucho tiempo a preparar los datos y a programar algoritmos manualmente o a utilizar bibliotecas para IA y aprendizaje automático, como TensorFlow. Por el contrario, los analistas de negocios tienden más a utilizar SQL para la elaboración de informes y herramientas populares de BI y visualización sobre esos conjuntos de datos consultados. Los usuarios avanzados del ámbito empresarial pueden ser capaces de manejar consultas más sencillas, pero se sienten más cómodos manipulando hojas de cálculo, como es el caso del personal de finanzas y planificación. Cada uno de estos usuarios tiene un conjunto único de necesidades, no solo en cuanto a los datos, sino también en cuanto a las herramientas que definen realmente cómo aprovechan los datos para realizar su trabajo. Puede obtener más información sobre la gama de soluciones de gestión de datos de Actian aquí.