Integración de datos

¿Cuál es la diferencia entre ETL e IPaaS?

Traci Curran

9 de julio de 2020

ETL e iPaaS

ETL (extracción, transferencia y carga) e IPaaS (plataforma de integración como servicio) son métodos de integración de datos para conectar entre sí distintos sistemas informáticos y fuentes de datos. Mientras que ETL es un conjunto de técnicas para mover datos, IPaaS es un conjunto más holístico de capacidades para mover e integrar datos entre sistemas de TI. IPaaS suele considerarse el sucesor o la "próxima generación" de herramientas ETL, optimizadas para funcionar en entornos informáticos modernos en la nube.

La transformación digital de las empresas ha provocado un rápido crecimiento del número de sistemas informáticos diversos que una empresa utiliza para respaldar sus procesos empresariales. Muchos de los sistemas modernos que están adoptando los usuarios empresariales son soluciones SaaS y plataformas operadas por terceros. Estos sistemas externos se combinan con sistemas internos (construidos por el departamento de TI de la empresa o instalados en los centros de datos de la empresa) para formar la columna vertebral de un conjunto de procesos empresariales habilitados por la tecnología. El éxito o el fracaso de las iniciativas de transformación digital suele depender de la eficacia del departamento de TI a la hora de gestionar las integraciones y el flujo de datos entre los distintos sistemas que utiliza la empresa.

¿Qué es ETL?

En la integración de datos se utilizan dos patrones de diseño principales. El primero es la replicación de datos. Aquí es donde entra en juego el ETL. Los procesos empresariales tradicionales se basan en el concepto de etapas de proceso independientes, similares a las estaciones de una cadena de montaje. Algo se crea en un lugar y luego se traslada a la siguiente estación de la cadena. Cuando se implantaron inicialmente los sistemas informáticos, se diseñaron para reproducir este proceso de cadena de valor. Los datos se crean en un sistema y luego se replican o se trasladan a sistemas posteriores donde se utilizan para otra cosa. El ETL fue un método revolucionario cuando se introdujo por primera vez y permitió la integración de sistemas de distintos proveedores, así como la capacidad de copiar datos operativos en un almacén de datos para archivarlos, analizarlos y elaborar informes.

El procesamiento ETL plantea dos retos que las empresas descubrieron rápidamente. El primero es el crecimiento exponencial de los datos y los costes de almacenamiento que lo acompañan. Si tiene 100 registros de datos en un sistema de origen y, mediante procesos ETL, replica esos datos en diez sistemas posteriores, tendrá que almacenar y mantener una cantidad de datos 10 veces mayor. El segundo problema es mantener actualizados los datos replicados. La mayoría de las operaciones ETL son lo que se denomina "procesamiento por lotes", en el que un grupo de transacciones se pone en cola y se traslada periódicamente a los sistemas posteriores. Es algo así como el correo que se apila en un buzón para que un cartero lo recoja y lo distribuya una vez al día. El procesamiento por lotes funcionaba bien en un entorno en el que los procesos empresariales eran muy manuales y se ejecutaban a lo largo de una serie de días o semanas. Los procesos empresariales digitales modernos deben funcionar en tiempo real y a menudo se completan en cuestión de minutos u horas.

IPaaS - Un enfoque moderno de la integración

La plataforma de integración como servicio (IPaaS) es el conjunto moderno de capacidades de integración de datos. La parte "como servicio" del nombre implica que la plataforma de integración es un tipo especializado de software alojado en la nube y suministrado mediante una suscripción. Actian DataConnect es un ejemplo de IPaaS. IPaaS incluye las capacidades heredadas de ETL (así como ELT) para el procesamiento por lotes, pero también proporciona facilidades para la integración transaccional en tiempo real, desempeñando el papel de "centro de datos" o "tejido de datos" para la organización. Algunas soluciones IPaaS también se pueden ejecutar sur site o como puente entre sistemas sur site y sistemas desplegados en la nube. Estas soluciones se denominan "IPaaS híbridas".

La gran diferencia entre ETL e IPaaS es la capacidad de integrar datos en tiempo real. Los procesos empresariales transformados digitalmente tienen una fuerte dependencia de la tecnología para permitir la productividad y la eficiencia, así como de los datos para impulsar la toma de decisiones. Las soluciones IPaaS ofrecen la capacidad de conectar todos sus sistemas informáticos y permitir el movimiento orquestado de datos en toda la organización, ya sea el procesamiento de transacciones en tiempo real, el análisis operativo para el control de procesos o el movimiento de datos a su almacén de datos para archivado y análisis de big data.

Las empresas modernas necesitan la flexibilidad que proporciona IPaaS. Actian DataConnect iPaaS es una plataforma de integración híbrida versátil que proporciona las capacidades que su empresa necesita para conectar sus sistemas de TI - proporcionando herramientas para la gestión segura, escalable y ágil de sus datos en cualquier lugar y en cualquier momento. Para obtener más información, visite www.actian.com/dataconnect.

Traci Curran headshot

Acerca de Traci Curran

Traci Curran es Directora de Marketing de Producto en Actian, centrada en la Plataforma de Datos Actian. Con más de 20 años de experiencia en marketing tecnológico, Traci ha desempeñado anteriormente funciones de marketing sénior en CloudBolt Software, Racemi (adquirida por DXC Corporation), así como en algunas de las startups más innovadoras del mundo. A Traci le apasiona ayudar a los clientes a comprender cómo pueden acelerar la innovación y obtener ventajas competitivas aprovechando la transformación digital y las tecnologías en la nube.