Gestire i picchi di traffico di un sito Web ottimizzando i costi grazie al Public Cloud
OVHcloud e Aplim


Costo dell'infrastruttura iniziale
diviso per 2

Dimensione dell'infrastruttura
moltiplicata per 10

Utilizzo
moltiplicato per 5
Executive Summary
Aplim, del gruppo Aplon, è una società specializzata nella distribuzione di software gestionali destinati agli istituti scolastici, dalla scuola dell’infanzia a quella superiore. I suoi clienti sono principalmente scuole private francesi.
Aplim si classifica al primo posto nel proprio segmento di mercato. Il suo segreto? Proporre soluzioni completamente personalizzabili e configurabili, in grado di rispondere a qualsiasi esigenza: iscrizioni, vita scolastica (frequenza, mensa, autorizzazioni all'uscita), agenda, spazi di lavoro, valutazioni, messaggistica, contabilità, fatturazione, ecc...
La soluzione EcoleDirecte, uscita nel 2000 e basata sul software Charlemagne, a distanza di 20 anni è utilizzata da oltre 1,5 milioni di studenti, 3 milioni di genitori, 300.000 insegnanti e 80.000 responsabili amministrativi.
Sebbene già diffuso, l’insegnamento a distanza è diventato la norma da un giorno all’altro a causa della crisi sanitaria legata al Covid-19 e dell’isolamento iniziato in Francia il 17 marzo 2020. Da quel momento, il sito ecoledirecte.com ha registrato il più alto numero di visite di sempre. Per garantire la continuità pedagogica, gli istituti di insegnamento francesi si sono trovati costretti ad adeguare rapidamente le proprie modalità di funzionamento e il sito gestito da Aplim è stato soggetto a elevati picchi di traffico. Fortunatamente, l'integrazione anticipata di nuovi servizi e l'automatizzazione dell'infrastruttura esistente hanno permesso di supportare questo afflusso massivo di connessioni simultanee. Una misura preventiva che si è rivelata una salvezza per l’azienda e i propri utenti.
La Sfida
Il trattamento di un elevato numero di dati personali relativi all'istruzione degli studenti francesi rendeva la loro protezione un aspetto fondamentale per Aplim, per cui era essenziale ospitare queste informazioni in Francia. Grazie alla presenza di diversi datacenter OVHcloud a Roubaix, Gravelines e Strasburgo, anche questa esigenza ha potuto ottenere risposta.
"Era fondamentale che i nostri dati fossero ospitati in Francia."
Steve Giraud, Responsabile dello sviluppo di Aplim
Per Aplim era inoltre necessario riuscire a gestire i costi legati alla propria infrastruttura e, allo stesso tempo, farla evolvere. Dopo un incontro avvenuto nel corso dell'OVHcloud Summit 2019, la società ha deciso di testare i servizi Public Cloud, per poi iniziare a estendere questa soluzione a una parte della propria infrastruttura all'inizio del 2020 utilizzando istanze Public Cloud anziché l'hosting Hosted Private Cloud. Il team tecnico si spinge così in una nuova fase di industrializzazione dei deploy e scopre la semplicità di utilizzo del Public Cloud, grazie alla grande reattività in termini di consegna delle risorse e alla disponibilità delle API standard di OpenStack. Il Proof of Concept (PoC) si rivela decisivo e l'azienda opta infine per il Cloud ibrido, che integra servizi di Cloud pubblico all'infrastruttura già esistente.
"Per la nostra infrastruttura avevamo bisogno di una soluzione che fossimo in grado di controllare al meglio."
Steve Giraud, Responsabile dello sviluppo di Aplim
Questa soluzione permette ad Aplim di utilizzare la piattaforma iniziale implementata in OVHcloud, basata sul servizio Hosted Private Cloud. In questo modo il team tecnico può usufruire della flessibilità e della solidità dei software di VMware, aumentando allo stesso tempo la capacità di assorbimento del carico.
A fronte delle nuove esigenze legate all'ottimizzazione dell'infrastruttura di EcoleDirecte, per la società era arrivato il momento di trovare soluzioni in grado di gestire i picchi di carico associati, in particolare, alla fluttuazione dell'attività e all'aumento esponenziale degli spazi di storage e backup.
Queste necessità possono essere osservate secondo due scenari:
- Scenario 1 - Picchi di traffico momentanei e prevedibili: Aplim è consapevole che gli studenti si connettono numerosi sulla piattaforma il lunedì, martedì e mercoledì tra le 16:00 e le 22:00. È un ciclo regolare durante il quale è necessario fornire risorse adeguate, in modo che i servizi rispondano con la stessa rapidità dei momenti di maggiore calma.
- Scenario 2 - Picchi di traffico imprevedibili e di maggiore intensità e durata: ancor prima del Covid-19, Aplim è consapevole della necessità di uno scaling rapido ed efficace in situazioni di emergenza. Mentre i picchi prevedibili sono facilmente gestibili, quelli inattesi possono presto diventare vere e proprie sfide.
Cos'è un picco di traffico?
Si tratta di un aumento improvviso del numero di richieste inviate o ricevute da un server in un breve intervallo di tempo. Senza un'infrastruttura adeguata, i picchi di traffico possono causare rallentamenti del servizio fino a renderlo potenzialmente inutilizzabile per gli utenti.
La Soluzione
L'architettura iniziale implementata su Hosted Private Cloud ospita tutti i servizi: sito pubblico, parte dei server API, database e backup.
Il vantaggio di questa soluzione è la semplicità di effettuare uno scaling verticale, ad esempio nel caso in cui un database richieda un numero maggiore di risorse. Il cluster VMware localizzato nei datacenter di Roubaix può inoltre essere esteso sia in host che in datastore.
Le esigenze di Aplim in termini di storage sono letteralmente esplose durante l’isolamento imposto dal Covid-19. Per rispondere a queste necessità, la società ha aggiunto dieci nuovi datastore SSD da 3 TB alla propria infrastruttura Hosted Private Cloud.
"Per evolvere avevamo bisogno di molta flessibilità, un'API che consentisse ai nostri DevOps di gestire le risorse e la possibilità di utilizzare più datacenter. Tutto questo è stato possibile grazie alla vRack e al Public Cloud."
Steve Giraud, Responsabile dello sviluppo di Aplim
Come già affermato, Aplim ha però dovuto considerare due possibili scenari, difficilmente compatibili con un tipo di infrastruttura basata esclusivamente su Hosted Private Cloud. Per gestire al meglio lo scenario caratterizzato da picchi di carico imprevisti e importanti in termini di intensità e durata, l'azienda ha realizzato un PoC utilizzando istanze Public Cloud.
Questa soluzione è efficace anche durante i picchi di traffico momentanei e prevedibili con periodo e variazione conosciuti, in quanto permette di programmare e industrializzare l'avvio di istanze in modo molto semplice, on demand e a intervalli orari precisi.
Grazie alla facilità di creazione e rimozione delle risorse, le istanze vengono fatturate solo 72 ore al mese invece di 720. Questo rapporto 1:10 assicura un servizio rapido e affidabile durante i picchi di carico e consente di massimizzare i costi. I server API, che utilizzano IIS, prevedono uno scaling orizzontale e si moltiplicano grazie all'automazione implementata da Aplim. Questo funzionamento è particolarmente adatto ai livelli applicativi stateless, come nel caso dei server API, e permette di ottimizzare le spese. Il PoC si è quindi rivelato decisivo.
Al punto che quando il governo francese ha annunciato l’inizio dell’isolamento e la continuità pedagogica a metà marzo 2020, Aplim è riuscita a far fronte al crescente numero di visite giornaliere. Il sito è passato da un milione di connessioni brevi e prevedibili al giorno a cinque milioni di connessioni giornaliere lunghe.
"Possiamo creare automaticamente istanze ogni sera per gestire i picchi di carico regolari e anche manualmente in caso di necessità occasionali. Il tutto in pochi minuti!"
Steve Giraud, Responsabile dello sviluppo di Aplim
Grazie a questa esperienza Aplim è stata in grado di reagire tempestivamente all'aumento delle connessioni massive. I server API e le 30 istanze iniziali garantivano tempi di risposta sufficienti, ma per sostenere l'aumento del carico è stato necessario aggiungerne 300 in pochi giorni.
In questa situazione, il lavoro dei team verso la massima industrializzazione dei deploy si è rivelato proficuo: invece di avviare 30 macchine come in periodi normali, è stato sufficiente eseguire 300 volte questa operazione durante i primi picchi di traffico verificatisi a metà marzo 2020.
Grazie alla reattività dei tecnici OVHcloud nei datacenter e alla disponibilità hardware, in pochi giorni è stato possibile consegnare 4.800 vCore e 18 TB di RAM. Le 300 istanze, connesse al resto dell'architettura attraverso la rete privata interdatacenter vRack, e l'industrializzazione tramite i servizi Public Cloud hanno permesso all’azienda di gestire il carico durante questo periodo eccezionale.
I Risultati
Nonostante tutto sia stato moltiplicato (l'infrastruttura per 10 e l'utilizzo per 5), l'adozione e l'utilizzo del Public Cloud prima della crisi sanitaria ha dimezzato il prezzo della piattaforma iniziale. Le scelte intraprese hanno infatti favorito un’ottimizzazione massima dei costi.
L'industrializzazione apportata alla soluzione Hosted Private Cloud di Aplim ed estesa con il Public Cloud ha permesso all'infrastruttura di svolgere tutti i suoi compiti senza incidenti. Inoltre, durante la pandemia una squadra di sviluppatori è stata dedicata alla creazione di strumenti di insegnamento a distanza. L’azienda ha ricevuto solo feedback positivi da parte di clienti e utenti e anche alcuni enti pubblici hanno deciso di contattarla.
Da questa esperienza è possibile trarre alcune best practice. Per prima cosa, l'industrializzazione delle azioni sulle infrastrutture: tutto può essere automatizzato via API. In secondo luogo la ripartizione dei carichi, condizione indispensabile per la gestione di uno scaling orizzontale. Infine l'alta disponibilità dei servizi, gestita tramite meccanismi chiamati auto-healing e dipendente dal software implementato. Se l'alta disponibilità dei servizi è stateless come nei server API, un semplice meccanismo di kill/create permette di rispondere facilmente a qualsiasi tipo di situazione. Se invece il modulo software è statefull, l'auto-healing verrà gestito da un meccanismo di cluster. Sulla base di questi principi, le funzionalità del Public Cloud consentono a qualsiasi azienda di gestire sia i picchi di carico previsti e temporanei che quelli imprevedibili e intensi.
La soluzione EcoleDirecte, in costante evoluzione, sta lavorando all'implementazione di nuove funzioni, tra cui l'integrazione dell'Object Storage per risolvere le problematiche legate all'archiviazione dei documenti.