Data Processing OVHcloud

Uma análise de dados simples e rápida com o Apache Spark

Quando pretende tratar os seus dados profissionais, dispõe de uma certa quantidade de informações, por um lado, e de uma questão, por outro, sob a forma de algumas linhas de código. Com o Data Processing, a OVHcloud encarrega-se de implementar em poucos minutos um cluster Apache Spark dedicado para responder à sua questão.

Paralelização dos tratamentos

O Apache Spark é o framework de referência para o tratamento maciço de dados. Permite a exploração de múltiplos nós de cálculo, ao mesmo tempo que armazena as operações em memória viva. Assim, o cliente escolhe ele próprio o nível de paralelização pretendido.

O cliente cria o código, nós implementamo-lo

Simplifique a sua vida. Somos nós que tratamos da implementação do cluster, o que permite que os nossos clientes se concentrem nas suas necessidades profissionais. Uma vez gerado o código Java ou Python, este último é executado diretamente no cluster.

Redução de custos

Em vez de conservar em permanência um cluster Apache Spark para operações de cálculo ocasionais, o Data Processing permite criar em poucos minutos um cluster dedicado sempre que o cliente precisa. Após a conclusão da análise, o cluster é libertado.

Casos de uso da nossa solução de Data Processing

Relatórios de desempenho

Milhões de linhas de dados tabulares a tratar, milhares de tweets a analisar, vários KPI a calcular... O Data Processing permite-lhe agregar volumes maciços de informação para os seus relatórios estratégicos, utilizados, por exemplo, em Data Science.

Conhecimento dos seus clientes

Pretende conhecer as utilizações da sua clientela europeia ou os centros de interesse dos seus utilizadores? Graças à biblioteca MLib integrada no Apache Spark, pode saber mais sobre os seus clientes: percurso, hábitos, distribuição... tudo é possível.

Melhoria da experiência de compra

No setor do e-commerce, é primordial recomendar aos seus clientes todos os produtos que possam interessar-lhes. Para isso, torna-se necessário analisar a totalidade dos carrinhos de compra, para detetar serviços complementares e oferecê-los no momento apropriado.

Como funciona a solução Data Processing?

Graças a uma otimização fina da implementação, a OVHcloud é capaz de criar e destruir rapidamente clusters Apache Spark utilizados para tratar grandes volumes de dados. Depois de implementado, o Spark percorre diretamente as informações, carrega-as para a memória e efetua a totalidade dos cálculos de uma só vez, antes de fornecer o resultado e libertar os recursos.

1

Inicialização

Com os seus dados, por um lado, e o seu código, por outro, solicite a criação de um cluster cuja dimensão responda às suas necessidades.

2

Envie o seu job

O Apache Spark distribui a carga pelo cluster recém-implementado.

3

Obtenha o resultado

Depois de os cálculos estarem prontos, obtenha simplesmente o resultado da análise.

Pricing Public Cloud

Faturação do Data Processing