Data Processing OVHcloud

Análisis simple y rápido de sus datos en Apache Spark

A la hora de procesar datos empresariales, disponemos, por un lado, de una determinada cantidad de información y, por otro, de una pregunta en forma de algunas líneas de código. Con Data Processing, OVHcloud se encarga de desplegar en unos minutos un cluster Apache Spark dedicado para dar respuesta a esta pregunta.

Paralelización del procesamiento

Apache Spark, el framework de referencia para el tratamiento masivo de datos, permite utilizar múltiples nodos de cálculo y almacenar las operaciones en la RAM. De este modo, podrá elegir el nivel de paralelización que mejor le convenga.

Despliegue simplificado

No se complique: OVHcloud se encarga de desplegar el cluster para que usted pueda centrarse en la actividad de su negocio. Una vez que haya generado su código Java o Python, este se ejecutará directamente en su cluster.

Reducción de los costes

Data Processing permite crear en cuestión de minutos un cluster dedicado cada vez que lo necesite. De este modo, no tendrá que mantener siempre activo un cluster Apache Spark para operaciones de cálculo ocasionales. Una vez completado el análisis, los recursos del cluster se liberarán.

Usos

Informe de rendimiento

Procesamiento de millones de líneas de datos tabulares, análisis de miles de tweets, cálculo de KPIs...: Data Processing permite agregar informaciones masivas para realizar informes estratégicos en el sector del data science, entre otros.

Conocimiento de sus clientes

¿Quiere conocer mejor los usos de sus clientes europeos o los centros de interés de sus usuarios? Gracias a la librería MLib integrada en Apache Spark, podrá recopilar información útil sobre sus clientes: recorrido, costumbres, distribución, y mucho más.

Experiencia de compra mejorada

En el sector del comercio electrónico, resulta fundamental poder recomendar a los clientes aquellos productos que puedan interesarles. Para ello, es necesario analizar los carritos de compras para identificar posibles servicios complementarios y poder ofrecerlos durante la visita.

¿Cómo funciona la solución Data Processing?

Gracias a la optimización del despliegue, OVHcloud es capaz de crear y eliminar de inmediato clusters Apache Spark utilizados para tratar grandes volúmenes de datos. Una vez desplegado, Spark recorrerá directamente las informaciones, las cargará en la memoria y, a continuación, realizará los cálculos necesarios de una vez antes de ofrecer el resultado y liberar los recursos.

1

Inicio

Con sus datos, por un lado, y su código, por otro, solicite la creación de un cluster cuyo tamaño se ajuste a sus necesidades.

2

Envíe su job

Apache Spark distribuirá la carga en el cluster que acaba de desplegar.

3

Cargar el resultado

Una vez realizados los cálculos, solo tendrá que cargar el resultado de su análisis.

Pricing Public Cloud

Facturación de Data Processing