Aplim - Case study
Aplim - dwa razy niższe koszty

Koszt początkowy infrastruktury
2 razy niższy

Aplim - dziesięciokrotne zwiększenie rozmiaru infrastruktury

Rozmiar infrastruktury
10 razy większy

Aplim - pięciokrotnie wyższe wykorzystanie zasobów

Wykorzystanie zasobów
5 razy większe

W skrócie

Aplim z grupy Aplon specjalizuje się w produkcji oprogramowania do zarządzania placówkami edukacyjnymi - od przedszkoli po uczelnie. Jego klientami są głównie prywatne szkoły francuskie.

Jest to wiodący gracz w swoim segmencie rynku. Jego sekret? Rozwiązania, które można w pełni dostosować do indywidualnych potrzeb i wykorzystywać do zarządzania następującymi obszarami: zapisy do placówki, życie szkolne (frekwencja, korzystanie ze stołówki, zezwolenia na opuszczenie terenu szkoły), kalendarz, przestrzeń edukacyjna, system oceniania, poczta elektroniczna, księgowość, etc.

Rozwiązanie EcoleDirecte, stworzone przez Aplim w 2000 r. na bazie oprogramowania Charlemagne, jest nadal wykorzystywane 20 lat później przez ponad 1,5 mln uczniów, 3 mln rodziców, 300 000 nauczycieli i 80 000 administratorów.

Kształcenie na odległość stawało się coraz bardziej popularne już od jakiegoś czasu, jednak wraz z wybuchem pandemii COVID-19 oraz lockdownem wprowadzonym we Francji w dniu 17 marca 2020 r., zostało uznane za normę. W związku z tymi wydarzeniami strona ecoledirecte.com zaczęła przeżywać prawdziwe oblężenie. Aby zapewnić ciągłość nauczania, placówki edukacyjne we Francji musiały dostosować swoje metody działania. Sytuacja ta bardzo szybko doprowadziła do dużych wzrostów ruchu na stronie WWW obsługiwanej przez Aplim. Na szczęście dzięki wcześniejszej integracji nowych usług i automatyzacji istniejącej infrastruktury udało się obsłużyć masowy strumień jednoczesnych połączeń. W ten sposób wprowadzone wcześniej działania prewencyjne okazały się prawdziwym ratunkiem dla firmy i jej użytkowników.

Wyzwanie

Aplim przetwarza dużą liczbę danych osobowych dotyczących edukacji francuskich uczniów. Ponieważ ochrona tych informacji jest dla firmy sprawą najwyższej wagi, ich hostowanie we Francji było kluczowym kryterium wyboru dostawcy usług. Centra danych OVHcloud w Roubaix, Gravelines i Strasburgu pozwoliły spełnić ten warunek.

Najbardziej zależało nam na tym, aby dane przechowywane były we Francji.
Steve Giraud, Manager ds. Rozwoju w Aplim

Niezwykle ważne dla firmy Aplim była również możliwość kontroli kosztów związanych z utrzymaniem i rozwojem infrastruktury. Po spotkaniu przedstawicieli spółek podczas OVHcloud Summit 2019 zapadła decyzja o przetestowaniu usługi Public Cloud. Następnie, na początku 2020 roku, firma Aplim zastosowała to rozwiązaniem w części swojej infrastruktury, wykorzystując instancje Public Cloud zamiast hostingu Hosted Private Cloud. Zespół techniczny Aplim rozpoczął następnie etap automatyzacji i bardzo docenił, że usługa Public Cloud jest prosta w obsłudze dzięki wysokiej elastyczności w zakresie dostarczania zasobów oraz dostępności standardowych interfejsów API OpenStack. Ponieważ wyniki testów Proof of Concept okazały się bardzo zadowalające, firma Aplim skłoniła się ku rozwiązaniom chmury hybrydowej, w ramach której instancje Public Cloud zostały zintegrowane z istniejącą infrastrukturą.

Potrzebowaliśmy rozwiązania, które pozwoliłoby nam zachować pełną kontrolę nad naszą infrastrukturą.
Steve Giraud, Manager ds. Rozwoju w Aplim

Aplim wykorzystał do rozbudowy rozwiązania platformę wdrożoną początkowo w OVHcloud na bazie usługi Hosted Private Cloud. Zyskał w ten sposób elastyczność oraz niezawodność gwarantowaną przez oprogramowanie VMware. Zwiększył jednocześnie swoją zdolność do obsługi wzrostów obciążeń.

Przy okazji wdrażania wszystkich tych zmian firma dostrzegła nowe potrzeby związane z optymalizacją infrastruktury EcoleDirecte. Nadszedł zatem czas, aby znaleźć rozwiązania, które umożliwiłyby zarządzanie wzrostami ruchu wywoływanymi przez wzmożoną aktywność użytkowników na stronie, a także rosnące zapotrzebowanie na przestrzeń dyskową.

Potrzeba nowych rozwiązań stała się szczególnie zauważalna w odniesieniu do dwóch sytuacji:

  • Scenariusz 1 - Tymczasowe i przewidywane wzrosty ruchu: według obserwacji Aplim szczególnie duża liczba uczniów loguje się do platformy w poniedziałki, wtorki i środy między godz. 16:00 a 22:00. W tym czasie konieczne jest zatem zapewnienie odpowiednich zasobów, aby usługi były w takim samym stopniu dostępne, jak w okresach mniejszego obciążenia.
     
  • Scenariusz 2 - Nieprzewidywane i znaczne wzrosty ruchu zarówno w zakresie intensywności, jak i czasu trwania. Aplim, jeszcze przed wybuchem kryzysu COVID-19, zdawał sobie sprawę z konieczności wdrożenia środków umożliwiających szybkie i skuteczne obsłużenie nagłych wzrostów obciążeń. O ile cyklicznymi wzrostami można łatwo zarządzać, o tyle nieoczekiwane wzrosty są prawdziwym wyzwaniem.

Co oznacza termin wzrost ruchu?

 

Wzrost ruchu jest to nagłe zwiększenie liczby zapytań wysyłanych i/lub otrzymywanych przez serwer w krótkim czasie. Bez odpowiedniej infrastruktury wzrost ruchu może spowodować spowolnienie usług, które potencjalnie może doprowadzić do ich całkowitej niedostępności.

Rozwiązanie

Architektura, którą Aplim wdrożył początkowo z wykorzystaniem Hosted Private Cloud obejmowała wszystkie komponenty: stronę WWW, część serwerów API, bazy danych oraz przestrzeń dyskową na kopie zapasowe.

Zaletą takiego rozwiązania jest to, że bardzo łatwo przeprowadzić skalowanie wertykalne, gdy, na przykład, baza danych wymaga więcej zasobów. Ponadto klaster VMware zlokalizowany w centrach danych w Roubaix może zostać rozbudowany o kolejne hosty lub datastores.

W czasie izolacji związanej z COVID-19 Aplim odnotował bardzo duży wzrost zapotrzebowania na przestrzeń dyskową. Aby sprostać oczekiwaniom użytkowników, firma dodała do swojej infrastruktury Hosted Private Cloud dziesięć nowych datastores SSD o pojemności 3 TB.

Do dalszego rozwoju potrzebowaliśmy dużej elastyczności oraz API, aby nasi deweloperzy mogli zarządzać zasobami i wdrażać je w kilku centrach danych. Stało się to możliwe dzięki usłudze vRack i Public Cloud.
Steve Giraud, Manager ds. Rozwoju w Aplim

Jednak, jak zostało wspomniane wcześniej, Aplim musiał przygotować się na stawienie czoła dwóm potencjalnym scenariuszom. Obsługa każdego z tych scenariuszy nie była możliwa przy wykorzystaniu infrastruktury opartej wyłącznie na Hosted Private Cloud. Zatem pod kątem scenariusza, w którym występują nieprzewidywalne, intensywne i długotrwałe wzrosty ruchu, firma przeprowadziła testy Proof of Concept z wykorzystaniem instancji Public Cloud.

Okazało się, że rozwiązanie Public Cloud sprawdzi się także doskonale w przypadku scenariusza, kiedy mamy do czynienia z tymczasowymi i możliwymi do przewidzenia wzrostami ruchu, gdyż w bardzo prosty sposób można zaprogramować i zautomatyzować uruchamianie instancji na żądanie, w precyzyjnie określonych przedziałach czasowych.

Bardzo dużym atutem instancji jest łatwość tworzenia i usuwania zasobów oraz fakt, że klient płaci miesięcznie tylko za 72 godziny wykorzystania infrastruktury zamiast za 720. Rozwiązanie to umożliwia zatem szybką i niezawodną obsługę wzrostów ruchu, a jednocześnie pozwala zoptymalizować koszty. Serwery API, działające z wykorzystaniem IIS, są skalowane horyzontalnie i rozbudowywane dzięki automatyzacji wdrożonej przez Aplim. Skalowanie horyzontalne jest dostosowane zwłaszcza do warstw aplikacyjnych stateless i umożliwia optymalizację wydatków. Wyniki testów Proof of Concept okazały się zatem bardzo wartościowe i wskazały nowe ścieżki rozwoju.

W związku z tym, kiedy rząd francuski ogłosił w połowie marca 2020 r. lockdown, firma Aplim bez problemu poradziła sobie ze wzrostem liczby codziennych wizyt na platformie. Wcześniej Aplim odnotowywał 1 milion wejść na stronę dziennie, w czasie lockdownu liczba ta wzrosła do 5 milionów, a czas odwiedzin znacznie się wydłużył.

Każdego wieczora możemy tworzyć instancje automatycznie, aby zarządzać cyklicznymi wzrostami ruchu, ale w przypadku nieprzewidzianych sytuacji możemy tworzyć instancje również ręcznie. Cała operacja trwa zaledwie kilka minut!
Steve Giraud, Manager ds. Rozwoju w Aplim

Dzięki wcześniej zdobytej wiedzy firma Aplim natychmiast zareagowała na nagły wzrost jednoczesnych połączeń. Do tej pory serwery API i 30 instancji zapewniały wystarczający czas odpowiedzi, w ciągu kilku dni firma musiała dodać 300 instancji, aby obsłużyć tak duży wzrost obciążenia.

Wcześniejsza praca, która polegała na wprowadzeniu narzędzi do automatyzacji wdrożeń, okazała się w tym momencie niezwykle cenna. Zamiast korzystać z 30 maszyn, jak to miało miejsce w czasie przed kryzysem, trzeba było uruchomić ich aż 300, aby stawić czoła pierwszym wzrostom ruchu w połowie marca 2020.

Dzięki reaktywności zespołów OVHcloud w centrum danych oraz dostępności sprzętowej, w ciągu kilku dni otrzymaliśmy 4 800 vCores i 18 TB pamięci RAM. Trzysta instancji, podłączonych do pozostałej części architektury za pośrednictwem prywatnej sieci vRack, oraz automatyzacja możliwa dzięki usłudze Public Cloud, pozwoliły firmie Aplim stanąć na wysokości zadania w tym wyjątkowo trudnym czasie.
Aplim infrastructure

Korzyści

O ile tuż przed wybuchem pandemii, dzięki zastosowaniu rozwiązania Public Cloud, wielkość infrastruktury zwiększyła się dziesięciokrotnie, a wykorzystanie zasobów pięciokrotnie, o tyle koszt utrzymania platformy dwukrotnie się zmniejszył.

Dzięki automatyzacji rozwiązania Hosted Private Cloud, rozbudowanego o usługę Public Cloud, infrastruktura Aplim okazała się niezawodna i podczas wzrostów ruchu nie wystąpił żaden incydent. Ponadto w czasie pandemii powołany został zespół deweloperów, których zadaniem było stworzenie narzędzi do zdalnego nauczania. Firma Aplim otrzymała wyłącznie pozytywne opinie od klientów i użytkowników, w tym od instytucji publicznych.

Całe to doświadczenie stało się dla Aplim cenną lekcją i pozwoliło zapamiętać na przyszłość kilka dobrych praktyk: po pierwsze, automatyzacja wszystkich operacji w infrastrukturze za pomocą API, po drugie, równoważenie obciążenia, które jest niezbędne w przypadku skalowania horyzontalnego, wreszcie, zapewnienie wysokiej dostępności usług. Odpowiedni poziom dostępności można uzyskać dzięki mechanizmom zwanym auto-healing oraz wdrożeniu odpowiedniego komponentu oprogramowania. Jeśli wysoka dostępność usług jest, tak jak serwery API, stateless, prosty mechanizm kill/create pozwala szybko zareagować na wszelkiego rodzaju krytyczne sytuacje. Jeśli komponent oprogramowania jest statefull, mechanizm klastra będzie zarządzał mechanizmem auto-healing. O ile użytkownik przestrzega wszystkich tych zasad, funkcje Public Cloud pozwolą mu bez problemu obsłużyć zarówno przewidywane, jak i niespodziewane wzrosty ruchu.

Firma Aplim stale udoskonala rozwiązanie EcoleDirecte, planuje w niedalekiej przyszłości wdrożyć kolejne funkcje, takie jak Object Storage, które pomogą stawić czoła wyzwaniom związanym z przechowywaniem dokumentów.