Wat is voorspellende analyse?


Predictive Analytics - De praktijk van het voorspellen van toekomstige resultaten

Predictive analytics is het gebruik van historische gegevens in combinatie met statistische algoritmen en machine learning-technieken om gefundeerde voorspellingen te doen over toekomstige gebeurtenissen, trends of gedrag.

Het vertegenwoordigt een significante verschuiving van traditionele business intelligence, die zich voornamelijk richt op beschrijvende analytics (wat in het verleden is gebeurd) en diagnostische analytics (waarom het is gebeurd). Voorspellende analyses willen in plaats daarvan een antwoord geven op de cruciale vraag: wat gaat er nu gebeuren?

Analytics OVHcloud

Waarom voorspellende analyses gebruiken?

Predictive data analytics gaat van achteraf naar vooraf. Bij het bekijken van eerdere verkooprapporten wordt uitgelegd wat u hebt verkocht (beschrijvend). Bij voorspellende analyses worden patronen binnen die verkoopgegevens geanalyseerd - mogelijk gecombineerd met demografische gegevens van klanten, marketinguitgaven of economische indicatoren - om toekomstige verkoopcijfers te voorspellen of te identificeren welke klanten waarschijnlijk binnenkort een aankoop zullen doen.

Enkele voorbeelden van wat u kunt genereren met voorspellende analyses zijn:

  • Een score die de waarschijnlijkheid aangeeft dat een klant zich zal omdraaien (stop met het gebruik van een service)
  • Een prognose van de vraag naar een product in het volgende kwartaal
  • Een waarschuwing die aangeeft dat het zeer waarschijnlijk is dat de apparatuur binnen een specifieke periode niet goed functioneert
  • Een segmentatie van prospects op basis van hun voorspelde kans om te reageren op een marketingcampagne

Uiteindelijk is het doel van het uitleggen en gebruiken van voorspellende analyses om organisaties in staat te stellen proactieve, gegevensgestuurde beslissingen te nemen.

Door te anticiperen op toekomstige mogelijkheden kunnen bedrijven activiteiten optimaliseren, risico's beperken, klantervaringen personaliseren en nieuwe kansen effectiever blootleggen dan alleen te vertrouwen op prestaties of intuïtie uit het verleden.

Hoe werkt voorspellende analyse?

Predictive analytics bereikt zijn prognosevermogen door verschillende wiskundige voorspellende modellen, die zelfs kunnen voorafgaan aan deep learning. Deze zijn niet uitwisselbaar; de beste aanpak hangt volledig af van de vraag die wordt gesteld en de aard van de beschikbare gegevens.

Inzicht in de belangrijkste typen modellen helpt om te verduidelijken hoe voorspellende analyses in de praktijk werken.

Classificatiemodellen

Classificatiemodellen zijn van fundamenteel belang wanneer het doel is een item toe te wijzen aan een vooraf gedefinieerde categorie of klasse. Ze beantwoorden in wezen "ja/nee"-vragen of bepalen "tot welke groep" iets behoort.

Deze modellen leren van historische gegevens waar de categorieën al bekend zijn (gelabelde gegevens), waarbij patronen worden geïdentificeerd die aan elke klasse zijn gekoppeld. Dit leren wordt vervolgens toegepast op nieuwe gegevenspunten om hun meest waarschijnlijke categorie te voorspellen.

Veelvoorkomende toepassingen zijn wijdverbreid, waaronder het filteren van e-mails in spam of niet, het voorspellen of een klant zich zal omdraaien of loyaal zal blijven, en het identificeren van financiële transacties als mogelijk frauduleus of legitiem.

Regressiemodellen

Wanneer de voorspelling een specifiek getal is in plaats van een categorie, worden lineaire regressiemodellen gebruikt, deze modellen richten zich op het voorspellen van continue numerieke waarden, het beantwoorden van vragen als "Hoeveel?" of "Hoeveel?"

Ze werken door de relatie tussen verschillende inputfactoren (onafhankelijke variabelen) en de doelwaarde (afhankelijke variabele) te analyseren en te modelleren. Een bedrijf kan bijvoorbeeld regressie gebruiken om toekomstige verkoopopbrengsten te voorspellen op basis van prestaties in het verleden en marketinginspanningen, of een vastgoedanalist kan dit gebruiken om de marktprijs van een huis te schatten, rekening houdend met de kenmerken en locatie ervan.

Het voorspellen van de vraag naar producten en het optimaliseren van de toewijzing van resources op basis van verwacht verkeer zijn andere belangrijke toepassingen. (Lineaire regressie is een fundamenteel voorbeeld.)

Clustermodellen

Clustermodellen onderscheiden zich van classificatie door het doel natuurlijke groeperingen in gegevens te ontdekken zonder op vooraf gedefinieerde labels te vertrouwen.

Ze verkennen de gegevens om vergelijkbare items samen te brengen in 'clusters' en beantwoorden de vraag: "Wat zijn de natuurlijke segmenten in deze gegevens?" De algoritmen identificeren gegevenspunten die gemeenschappelijke kenmerken delen, en scheiden deze van andere, ongelijksoortige punten. Deze techniek is zeer waardevol voor de segmentering van klanten, waarbij bedrijven groepen klanten met vergelijkbaar gedrag kunnen vinden voor gerichte marketingcampagnes.

Andere toepassingen zijn het groeperen van gerelateerde documenten of onderzoekspapers op basis van inhoud, en soms het identificeren van ongebruikelijke gegevenspunten die niet goed passen in een cluster, wat een vorm van anomaliedetectie kan zijn. (K-Means is een algemeen gebruikt clusteralgoritme.)

Time Series-modellen

Voorspellende modellering omvat vaak het voorspellen van toekomstige waarden op basis van prestaties in het verleden in de loop van de tijd. Dit is de specialiteit van tijdreeksmodellen, die reeksen gegevenspunten analyseren die met regelmatige tijdsintervallen (bijvoorbeeld dagelijks, maandelijks, jaarlijks) worden verzameld.

Ze zijn op unieke wijze ontworpen om rekening te houden met de afhankelijkheden in de tijd in de gegevens en patronen te identificeren zoals langetermijntrends, voorspelbare seizoensvariaties (seizoensgebondenheid) en andere tijdgerelateerde cycli.

Dit maakt ze essentieel voor taken als financiële prognoses (het voorspellen van aandelenkoersen of wisselkoersen), weersvoorspellingen, resourceplanning (het inschatten van het toekomstige callcenter-volume of de energievraag) en het optimaliseren van voorraadbeheer door te anticiperen op toekomstige verkopen. (Modellen zoals ARIMA en Exponential Smoothing (ETS) worden vaak gebruikt.)

Hoe werkt voorspellende analyse?

Predictive analytics is een systematisch proces dat ruwe gegevens omzet in waardevolle toekomstige inzichten met behulp van gesuperviseerde machine-learningmodellen. Hoewel de specifieke tools en technieken complex kunnen zijn, volgt de algehele workflow over het algemeen een reeks logische stappen, waarbij gegevens uit een datawarehouse of datalakeHouse worden opgehaald. Vaak moet dit gedurende het proces worden herhaald en verfijnd.

  1. Definitie van het doel : De reis begint met een duidelijk begrip van het zakelijke probleem of de zakelijke vraag. Welke concrete uitkomst willen we voorspellen? Het is van cruciaal belang een precieze doelstelling te definiëren, omdat deze richting geeft aan elke volgende stap, van het verzamelen van gegevens tot het selecteren en evalueren van modellen.
     
  2. Verzamelen van gegevens Zodra het doel duidelijk is, is de volgende stap het verzamelen van de benodigde gegevens. Hierbij worden relevante gegevensbronnen geïdentificeerd, zoals CRM-systemen (Customer Relationship Management), transactiedatabases of sensormetingen.
     
  3. Data voorbereiden: Onbewerkte gegevens zijn zelden onmiddellijk klaar voor analyse. Deze fase, vaak de meest tijdrovende, omvat het opschonen en transformeren van de gegevens. Het opschonen van gegevens is gericht op problemen zoals ontbrekende waarden, fouten, duplicaten en inconsistenties. Het doel is om een schone, betrouwbare dataset te maken die nauwkeurig de factoren weerspiegelt die de uitkomst die u wilt voorspellen beïnvloeden.
     
  4. Modelselectie : Met voorbereide gegevens verschuift de focus naar het kiezen van het juiste voorspellende model. De keuze hangt sterk af van het in stap 1 gedefinieerde doel. Vaak experimenteren datawetenschappers met meerdere modellen om de beste pasvorm te vinden.
     
  5. Model training : Dit is waar het leren plaatsvindt. De voorbereide historische gegevens (meestal een groot deel ervan, bekend als de 'trainingsset') worden ingevoerd in de geselecteerde algoritme(n). Het algoritme verwerkt deze gegevens en identificeert patronen, relaties en correlaties die verband houden met de resultaten van de interesse.
     
  6. Model evaluation : Een model dat getraind is op data is niet bruikbaar, tenzij de voorspellende nauwkeurigheid ervan geverifieerd kan worden. De prestaties van het model worden getest met een apart deel van de historische gegevens die het nog nooit heeft gezien (de 'testset'). Er worden verschillende statistische maatstaven gebruikt om te beoordelen hoe nauwkeurig het model resultaten voorspelt in vergelijking met de werkelijke resultaten in de testgegevens.
     
  7. Modelimplementatie : Na validatie is het voorspellende model klaar om in actie te komen. Implementatie houdt in dat het model in de relevante operationele systemen of bedrijfsprocessen wordt geïntegreerd.

Het voorspellende analyseproces eindigt niet met implementatie. Gegevenspatronen kunnen in de loop van de tijd veranderen (een concept dat 'modeldrift' wordt genoemd), waardoor de nauwkeurigheid van het model mogelijk wordt verminderd.

Daarom is het essentieel om continu de prestaties van het model in de live omgeving te monitoren. Regelmatig onderhoud, waarbij het model mogelijk opnieuw moet worden getraind met nieuwe gegevens of zelfs moet worden herontworpen als fundamentele patronen veranderen, zorgt ervoor dat de voorspellingen accuraat en relevant blijven in de loop van de tijd.

Over het algemeen is het een gestructureerd, iteratief proces - van het definiëren van de zakelijke behoefte via gegevensverwerking, modellering en doorlopende monitoring - dat de ruggengraat vormt van hoe voorspellende analyses historische gegevens effectief omzetten in uitvoerbare prognoses.

Gebruik van voorspellende analyses

De echte kracht van voorspellende analyses ligt in de veelzijdigheid ervan en in het vermogen om tastbare waarde te genereren in bijna elke sector en bedrijfsfunctie.

Door verder te gaan dan historische rapporten en te anticiperen op toekomstige resultaten, kunnen organisaties slimmere, proactieve beslissingen nemen die prestaties optimaliseren, risico's verminderen en klantervaringen verbeteren. Hier zijn enkele belangrijke gebieden waar voorspellende analyses een significante impact hebben.

CRM en marketing

Het begrijpen van en anticiperen op klantgedrag is essentieel voor de groei van uw bedrijf. Met voorspellende analyses kunnen bedrijven de klantomloop voorspellen door personen te identificeren die waarschijnlijk zullen vertrekken, zodat proactieve retentiestrategieën kunnen worden geïmplementeerd.
 

Het helpt bij het inschatten van de waarde van de levensduur van de klant (Customer Lifetime Value, CLV), waardoor bedrijven hun resources kunnen richten op segmenten met een hoge waarde.
 

Marketingcampagnes worden effectiever door het modelleren van verkoopkansen (door te voorspellen welke klanten het meest waarschijnlijk reageren op specifieke aanbiedingen) en het scoren van leads (door verkoopleads te prioriteren op basis van de voorspelde kans op conversie). Gevoelsanalyse van feedback van klanten kan ook wijzen op verschuivingen in de merkperceptie.

Operaties en risicobeheer

Efficiëntie en beveiliging zijn van het allergrootste belang bij de exploitatie. Voorspellend onderhoud is een opvallende toepassing die sensorgegevens gebruikt om apparatuurstoringen te voorspellen voordat ze optreden, waardoor downtime en reparatiekosten bij productie, energie en transport worden geminimaliseerd.
 

Met fraudedetectiemodellen worden transactiepatronen in realtime geanalyseerd om verdachte activiteiten in het bankwezen, het verzekeringswezen en de e-commerce te identificeren en te markeren, waardoor aanzienlijke bedragen worden bespaard.
 

Organisaties gebruiken ook voorspellende analyses voor optimalisering van resources, het voorspellen van de vraag om personeel op de juiste manier in te plannen of om het energieverbruik effectiever te beheren. In cyberbeveiliging helpt het potentiële netwerkbedreigingen of gegevenslekken te voorspellen en te identificeren.

Financiën en verzekeringen

De financiële dienstensector vertrouwt sterk op voorspellende analyses voor risicobeoordeling en het identificeren van kansen. Kredietscoremodellen voorspellen de waarschijnlijkheid van wanbetalingen op leningen en vormen de basis voor beslissingen over leningen.
 

Verzekeringsmaatschappijen gebruiken voorspellende modellen om risico's nauwkeuriger in te schatten bij het bepalen van hun prijsbeleid en om de waarschijnlijkheid en potentiële kosten van toekomstige claims te voorspellen. Algoritmische handel gebruikt voorspellende modellen om marktbewegingen te voorspellen en transacties automatisch uit te voeren.

Gezondheidszorg

Predictive analytics biedt een enorm potentieel voor het verbeteren van de resultaten van patiënten en de operationele efficiëntie in de gezondheidszorg.
 

Het kan worden gebruikt om uitbraken van ziekten te voorspellen op basis van gegevens over de volksgezondheid, patiënten te stratificeren op basis van hun risico op het ontwikkelen van bepaalde aandoeningen of complicaties en het voorspellen van het percentage ziekenhuisopnames om gerichte interventies mogelijk te maken. Het speelt ook een rol in de gepersonaliseerde geneeskunde, en helpt de respons van patiënten op verschillende behandelingen te voorspellen.

Detailhandel en e-commerce

In het competitieve detailhandellandschap stimuleert voorspellende analyses personalisatie en efficiëntie. Vraagprognose helpt voorraadniveaus te optimaliseren, stockouts te verminderen en overvoorraad aan te vullen.
 

Aanbevelingsengines, die gebruikelijk zijn op e-commercesites en streamingplatforms, voorspellen welke producten of inhoud een gebruiker waarschijnlijk zal interesseren en verbeteren zo de betrokkenheid en verkoop. Prijsoptimalisatiemodellen stellen retailers in staat om concurrerende prijzen te bepalen op basis van de verwachte vraag en acties van concurrenten.

Productie- en toeleveringsketen

Naast voorspellend onderhoud gebruiken fabrikanten voorspellende analyses voor kwaliteitscontrole, waarmee ze factoren identificeren die productdefecten op de productielijn voorspellen.
 

In de supply chain optimaliseert het de logistiek door verzendtijden te voorspellen, de vraag tussen verschillende nodes te voorspellen en potentiële verstoringen te identificeren.
 

Deze voorbeelden krabben alleen maar aan het oppervlak. Van het optimaliseren van stadsdiensten tot het verbeteren van landbouwopbrengsten: de toepassingen van voorspellende analyses blijven groeien, waardoor de manier waarop organisaties gegevens gebruiken om te anticiperen en hun toekomst vorm te geven, fundamenteel verandert.

Onze data-oplossingen

De krachtige suite van datacentergerichte oplossingen van OVHcloud is ontworpen om u te helpen uw gegevens effectief te managen, te verwerken, te analyseren en te benutten.

Van het bouwen van robuuste dataplatforms en het uitvoeren van grootschalige analyses tot het implementeren van geavanceerde artificiële intelligentie en machine learning-modellen: onze tools bieden de prestaties, schaalbaarheid en controle die u nodig hebt om gegevens om te zetten in bruikbare inzichten en uw bedrijf vooruit te helpen:

Public Cloud Icon

Data Analytics-oplossingen

Ontsluit de kracht van uw gegevens met het Cloud Analytics-platform van OVHcloud. Verzamel, bewaar, verwerk en visualiseer moeiteloos grote datasets met opensourcebig datatechnologieën zoals Apache Spark, Hadoop en Kafka. Onze gemanagede oplossingen vereenvoudigen complexe gegevenspijplijnen, waardoor u zich kunt richten op het verkrijgen van waardevolle inzichten.

Hosted Private cloud Icon

Data Platform

Bouw een robuuste basis voor uw gegevensstrategie met het uitgebreide Data Platform van OVHcloud. Deze geïntegreerde suite biedt beheerde databases, objectopslag, gegevensverwerkingstools en orkestratiemogelijkheden.

Bare MetaL Icon

AI-oplossingen

Versnel uw projecten op het gebied van artificiële intelligentie met de AI- & Machine Learning-oplossingen van OVHcloud. Maak gebruik van krachtige computerbronnen, waaronder krachtige GPU's, en maak gebruik van beheerde platforms voor naadloze modeltraining, implementatie en beheer (MLOps). Van gegevensvoorbereiding en -experimenten met AI-laptops tot het implementeren van schaalbare AI-toepassingen met AI Deploy: onze tools stellen datawetenschappers en ontwikkelaars in staat om efficiënt en kosteneffectief geavanceerde AI-modellen te bouwen en te draaien, waardoor ze de hele machine learning-levenscyclus ondersteunen.