Plataforma de datos

Big Data como servicio (BDaaS)

Una sólida plataforma de datos multicapa

Utilizando servicios basados en la nube, Big Data as a Service (BDaaS) permite a una empresa analizar conjuntos de datos grandes o complejos.

¿Por qué son importantes los macrodatos como servicio?

El enfoque tradicional para acceder a la información que ofrecen los macrodatos consiste en adquirir un clúster de servidores alojados en un centro de datos local. Esto requiere un gasto inicial y retrasos mientras el departamento de TI adquiere, instala, configura y prueba los componentes de hardware y software. La escalabilidad está limitada a la cantidad de hardware adquirido, y quedarse sin capacidad implica costosas actualizaciones y más retrasos.

¿Cuáles son las ventajas de Big Data como servicio?

Las principales ventajas de utilizar big data como servicio son las siguientes:

  • Economía de la nube - La empresa puede contratar un servicio de suscripción sin inversión inicial y sólo teniendo que pagar por el processeur y el almacenamiento consumidos.
  • Escalabilidad elástica: un servicio basado en la nube puede proporcionar processeur y almacenamiento à la demande casi al instante y mucho más de lo que puede hacerlo un centro de datos interne .
  • Tiempo de obtención de valor: es más corto con un servicio de big data, ya que el hardware y el software necesarios están disponibles en cuanto comienza la suscripción o la prueba, sin tener que esperar al departamento de TI.
  • Gestión de sistemas: los proveedores basados en la nube gestionan la mayoría de las tareas de gestión de sistemas de bajo nivel, lo que reduce la sobrecarga de gestión de los equipos informáticos interne .
  • Actualizaciones de software: las gestiona el proveedor de la nube o de SaaS, lo que reduce temps d'arrêt en comparación con las implantaciones locales tradicionales.
  • Alta disponibilidad: las soluciones basadas en la nube pueden ofrecer servicios de reprise après sinistre mediante la replicación de servicios en varios centros de datos en la nube de distintas geografías, lo que reduce cualquier impacto debido a temps d'arrêt por cortes de energía o desastres naturales que pudieran afectar a un único centro de datos.

Retos potenciales

  • Cumplimiento de datos: muchas empresas manejan datos regulados que deben conservarse in situ en el centro de datos de la empresa. Una nube privada suele cumplir los requisitos de conformidad, ya que los datos nunca abandonan el entorno de nube dedicado de la organización.
  • Análisis de datos - Los datos tienen que subirse a la nube para realizar el análisis de datos. Esto puede llevar tiempo. Lo ideal es que la empresa cree su lago de datos o almacén de big data en su plataforma en la nube preferida para poder procesarlos allí donde se crean.
  • Migración de datos: trasladarse a otro proveedor de servicios en la nube puede resultar caro, ya que suelen cobrar una tasa de salida basada en volume de données. Este sería el caso de las ofertas de datos proporcionadas por proveedores de SaaS basados en la nube o soluciones de datos de proveedores de servicios en la nube como Google y AWS.

Servicios de Big Data

Todos los principales proveedores de nube ofrecen servicios para que los clientes planifiquen sus almacenes de big data existentes en la nube. Entre ellos se incluyen:

  • Amazon Web Services (AWS) proporciona Elastic MapReduce (EMR) para ofrecer BDaaS.
  • Microsoft Azure HDInsight es una solución de big data basada en la nube que proporciona clústeres gestionados de Hadoop, Spark y Hive.
  • Google Cloud Platform (GCP) - Google Cloud Dataproc es un servicio en la nube entièrement géré para ejecutar clústeres de Apache Spark y Apache Hadoop.
  • Actian ofrece BDaaS, que es portátil en los tres proveedores de nube, ofreciendo a los clientes la flexibilidad de ejecutar análisis independientemente de la plataforma de nube que aloje sus datos.

Actian

Actian Data Platform está diseñada para ofrecer BDaaS en AWS, Azure y Google Cloud. La plataforma utiliza la API Spark de Hadoop para acceder a los formatos de datos, incluidos ORC y Parquet. Las consultas de Actian Data Platform pueden conectar datos a través de instancias de almacén de datos. Esta función de consulta distribuida permite a los clientes almacenar sus datos cerca de donde se crean y realizar análisis de datos dondequiera que residan.

Las capacidades de integración de datos de Actian Data Platform funcionan con estructuras de almacenamiento de datos populares, incluidos los buckets de S3, las carpetas de Google Drive y el almacenamiento Azure Blob.

détection des fraudes

Una de las mayores aseguradoras de automóviles del Reino Unido utiliza la plataforma de datos Actian para la détection des fraudes. Muchas variables entran en el cálculo de la prima de seguro de un cliente potencial, como datos demográficos, puntuación crediticia, reclamaciones de seguros e historial de conducción. También utilizan Actian para crear modelos que detecten anomalías y posibles cuentas fraudulentas.

Tramitación de siniestros sanitarios

La tramitación de las reclamaciones sanitarias puede ser muy compleja y llevar mucho tiempo. Las aseguradoras sanitarias confían en agencias externas para validar las reclamaciones, asegurarse de que los proveedores de asistencia no cobran de más a los pacientes por los tratamientos y detectar reclamaciones fraudulentas. Los macrodatos como servicio desempeñan un papel crucial a la hora de garantizar que se dispone de suficiente potencia de cálculo para procesar los picos. Los datos de reclamaciones incluyen datos no estructurados en forma de documentos escaneados y datos estructurados de sistemas de facturación que deben procesarse.

Venta al por menor

Un gran minorista estadounidense que opera cientos de tiendas de conveniencia en paradas de camiones y pequeñas ciudades utiliza BDaaS para analizar las cestas de la compra de los compradores y así poder optimizar los productos para cada punto de venta. Una cadena de ferreterías de capital francés utiliza big data como servicio para proyectar la demanda futura en función de las estaciones del año, las vacaciones y los patrones meteorológicos previstos, de modo que puedan aprovisionarse de forma proactiva para las condiciones esperadas.