Wat is Automated Machine Learning?


Het hoofddoel van Automated Machine Learning (AutoML) is het proces van het bouwen en implementeren van machine-learningmodellen te vereenvoudigen en te versnellen door verschillende fasen van de machine-learningpipeline te automatiseren.

machine learning

Wat is Automated Machine Learning (AutoML)?

Automatisch Machine Learning, ook wel bekend als AutoML, is het proces van het automatiseren van de end-to-end taken die gepaard gaan met het bouwen, trainen en implementeren van machine learning-modellen.

Het omvat een reeks werkstroomtechnieken en werksets voor machine learning die ontworpen zijn om de toepassing van machine learning eenvoudiger en efficiënter te maken. In plaats van te vertrouwen op gegevenswetenschappers om elke stap handmatig uit te voeren - van voorverwerking van gegevens, functie-engineering en functieselectie tot algoritmeselectie en hyperparameteroptimalisatie - streven AutoML-systemen ernaar deze vaak tijdrovende en complexe processen te automatiseren.

Dit maakt het maken van effectieve machine learning-algoritmen met minimale menselijke tussenkomst mogelijk, waardoor de kracht van machine learning voor een breder publiek beschikbaar wordt.

Belangrijkste doelstellingen van AutoML

De ontwikkeling en acceptatie van AutoML worden gedreven door verschillende belangrijke doelstellingen:

  • Toegankelijkheid Een van de belangrijkste doelen is om machine-gesuperviseerd leren te democratiseren door het toegankelijk te maken voor individuen die mogelijk geen diepgaande expertise in training of programmeren op het gebied van data science hebben. Hiertoe behoren domeinexperts, businessanalisten en ontwikkelaars die AutoML-tools kunnen inzetten om voor hun specifieke behoeften te bouwen.
     
  • Efficiëntie en productiviteit : Het doel van AutoML is om de productiviteit van datawetenschappers aanzienlijk te verhogen door repetitieve en arbeidsintensieve ML-stappen en -taken te automatiseren. Hierdoor hebben ze meer tijd om zich te richten op meer strategische aspecten van een project, zoals het formuleren van problemen, het interpreteren van gegevens en het communiceren van resultaten.
     
  • Prestaties: Door systematisch een uitgebreide reeks modelarchitecturen en hyperparameters te verkennen, kan AutoML vaak goed presterende modellen identificeren die in een handmatige zoekopdracht over het hoofd kunnen worden gezien. Het doel is om een optimale voorspellende nauwkeurigheid en robuustheid te bereiken.
     
  • Snelheid: Het automatiseren van de pipeline voor modelontwikkeling versnelt de tijd die nodig is om van onbewerkte gegevens naar een implementeerbaar model in de pipeline voor machine learning te gaan. Dit is essentieel in snel veranderende omgevingen waar snelle inzichten en oplossingen nodig zijn.

AutoML-tools kunnen ook helpen ervoor te zorgen dat MLOps reproduceerbaar is door het proces te standaardiseren en de configuraties en stappen bij te houden die zijn ondernomen om een model te bouwen.

Het faciliteert de schaalbaarheid van machine learning-toepassingen binnen een organisatie door meer modellen met minder resources te bouwen en te onderhouden. AutoML kan een basislijn bieden voor modelprestaties, waarmee handmatig ontwikkelde modellen kunnen worden vergeleken.

Waarom automatisch machine learning?

De drang om machine training te automatiseren komt voort uit de inherente complexiteit en eisen van de traditionele machine learning workflow, gekoppeld aan de significante voordelen die automatisering kan opleveren. Een goed begrip van deze aspecten benadrukt de waardepropositie van geautomatiseerd machine learning.

Uitdagingen in traditioneel machine learning

Het traditioneel ontwikkelen van machine learning is een uiterst iteratief en vaak moeizaam proces, dat met een aantal uitdagingen gepaard gaat:

  • Tijdrovend en resource-intensief : Het traject van onbewerkte gegevens naar een implementeerbaar model omvat talrijke stappen, waaronder het opschonen van gegevens, voorverwerking, functie-engineering, modelselectie, afstemming van hyperparameters en validatie. Elk van deze fasen kan veel tijd en rekenkracht vergen. Vooral functie-engineering en hyperparameteroptimalisatie staan erom bekend dat ze zeer arbeidsintensief zijn.
     
  • Vereist gespecialiseerde expertise : Het opbouwen van effectief machine learning vereist doorgaans een diepgaand begrip van verschillende algoritmen, statistische principes, technieken voor dataverwerking en programmeervaardigheden. Deskundigen op deze gebieden (data scientists, machine learning engineers) zijn schaars en dus duur.
     
  • Complexiteit van modelselectie en afstemming : Met een breed scala aan beschikbare algoritmen voor training en een nog grotere ruimte aan mogelijke hyperparameterconfiguraties voor elk, kan het kiezen van de optimale combinatie voor een bepaald probleem een ongelooflijk uitdaging zijn. Het impliceert vaak een aanzienlijke hoeveelheid vallen en opstaan, en vertrouwt zwaar op de ervaring en intuïtie van de datawetenschapper.
     
  • Problemen met reproduceerbaarheid en schaalbaarheid : Het garanderen van reproduceerbaarheid van de resultaten kan moeilijk zijn als het gegevensproces niet nauwkeurig wordt gedocumenteerd en gestandaardiseerd. Het opschalen van handmatige inspanningen voor meerdere projecten of grotere datasets levert ook aanzienlijke hindernissen op.

Het is ook waar dat een handmatige workflow vatbaar is voor menselijke fouten en cognitieve vooroordelen, die onbedoeld de modelselectie of -evaluatie kunnen beïnvloeden, wat kan leiden tot suboptimale of oneerlijke resultaten.

Voordelen van automatisering

Automatisering van machine learning biedt interessante oplossingen voor deze uitdagingen en brengt talrijke voordelen met zich mee:

  • Hogere snelheid en efficiëntie : AutoML versnelt de ontwikkelingscyclus van het model aanzienlijk. Door repetitieve taken zoals het afstemmen van hyperparameters en modelselectie te automatiseren, kunnen iteraties en experimenten veel sneller worden uitgevoerd, waardoor de time-to-market voor oplossingen op basis van ML wordt verminderd.
     
  • Hogere productiviteit Data scientists kunnen veel van de meer vervelende aspecten van modelbouw overdragen naar AutoML-systemen. Hierdoor kunnen ze zich concentreren op activiteiten met een hogere waarde, zoals het formuleren van problemen, het begrijpen van bedrijfsbehoeften, het interpreteren van resultaten en het zorgen voor ethische implementatie van artificiële intelligentie.
     
  • Democratisering van machine learning : AutoML-tools verlagen de toetredingsdrempel, waardoor personen met minder gespecialiseerde kennis, zoals domeinexperts, businessanalisten en softwareontwikkelaars, machine-learningmodellen effectief kunnen bouwen en gebruiken. Dit helpt artificiële intelligentiecapaciteiten breder in te bedden in een organisatie.

Door systematisch een breder scala aan algoritmen voor training, functieverwerkingstechnieken en hyperparameterinstellingen te verkennen dan normaal gesproken mogelijk is door handmatige inspanningen, kan AutoML vaak modellen ontdekken die superieure prestaties en generalisatie gebruiken.

Hoe werkt AutoML?

AutoML-systemen functioneren door de verschillende fasen van de traditionele machine learning-pipeline intelligent te automatiseren. Ze maken gebruik van een combinatie van beproefde technieken en baanbrekend onderzoek om door de grote ruimte van mogelijke trainingsoplossingen te zoeken, gericht op het vinden van het optimale model voor een bepaalde dataset en taak met minimale menselijke tussenkomst.

Automatische ML-pipeline-stappen

AutoML stroomlijnt het traject van onbewerkte gegevens naar een geoptimaliseerd model door een reeks kritieke stappen in de machine learning-pipeline te automatiseren.
 

Dit begint meestal met data-invoer en essentiële voorverwerking, gevolgd door geavanceerde geautomatiseerde selectie om gegevens voor te bereiden voor modellering.
 

Het systeem onderzoekt vervolgens op intelligente wijze verschillende geschikte machine learning-algoritmen en maakt gebruik van geautomatiseerde optimalisatie van hyperparameters om hun prestaties te verfijnen.

Core Learn-technologieën in AutoML

De engine die gebruik maakt van de mogelijkheden van AutoML is gebaseerd op diverse kerntechnologieën. Prominent zijn onder andere geavanceerde hyperparameteroptimalisatiealgoritmen, zoals Bayesiaanse optimalisatie, evolutionaire algoritmen en eenvoudigere zoekmethoden, die efficiënt de beste modelinstellingen vinden.
 

Voor deep learning automatiseert het gebruik van Neural Architecture Search (NAS) het ontwerp van complexe neurale netwerken. Met meta-learning kunnen systemen leren van ervaringen uit het verleden om nieuwe taken effectiever aan te pakken.
 

Bovendien combineert het gebruik van geautomatiseerde ensemble-methoden strategisch meerdere learningmodellen, terwijl gespecialiseerde technieken het maken van functies en de algehele constructie en optimalisatie van het gehele machine-learningproces automatiseren. Dit betekent collectief het gebruik van efficiënte en effectieve modelgeneratie.

Veelvoorkomende use cases voor automatische ML

Automated Machine Learning heeft praktische toepassingen gevonden in een breed scala aan probleemtypen en sectoren, waardoor de implementatie van AI-oplossingen wordt versneld en nieuwe mogelijkheden worden geboden.

De mogelijkheid om een complex gegevensproces te stroomlijnen maakt het van onschatbare waarde voor veelvoorkomende machine learningtaken, maar ook voor meer gespecialiseerde domeinen waar het in het echte leven gebruikt wordt.

Classificatie en regressie

Classificatie en regressie zijn fundamentele taken voor gecontroleerd leren waarbij AutoML met name schittert.

Voor classificatieproblemen, die het voorspellen van een categorisch label inhouden (bijvoorbeeld spam of geen spam, churn van de klant of geen churn, medische diagnose), kunnen Auto ML-systemen snel verschillende algos testen, zoals logistieke regressie, ondersteuning van vectormachines, beslisbomen en ensemble-methoden, samen met het gebruik van uitgebreide functie-engineering en het afstemmen van hyperparameters, om zeer nauwkeurige classificeerders te bouwen.

Op dezelfde manier automatiseert Auto ML voor regressietaken, die tot doel hebben een continue numerieke waarde te voorspellen (bijvoorbeeld huizenprijzen, voorraadwaarden, verkoopprognoses, temperatuur), het proces van het vinden van de best passende modellen, het verwerken van functieschaling en transformaties om prestaties te optimaliseren voor statistieken als Mean Squared Error of R-Squared Error.

Hierdoor kunnen organisaties snel tools gebruiken voor fraudedetectie, risicobeoordeling, vraagprognose en gepersonaliseerde marketing.

Computer Vision

In Computer Vision wordt AutoML steeds vaker gebruikt om taken aan te pakken die traditioneel veel expertise vereisen in het gebruik van beeldverwerking en neuraal netwerkontwerp.

Automatische ML, met name door middel van technieken zoals Neural Architecture Search (NAS) en geautomatiseerd transfer learning met vooraf getrainde modellen, helpt bij het automatisch ontwerpen en optimaliseren van convolutionaire neurale netwerken (CNN's) voor taken zoals afbeeldingsclassificatie (bijvoorbeeld het identificeren van objecten in afbeeldingen), objectdetectie (het vinden en categoriseren van meerdere objecten in een afbeelding) en afbeeldingssegmentatie (het partitioneren van een afbeelding in zinvolle segmenten).

Dit maakt een snellere ontwikkeling van applicaties mogelijk op gebieden als medische beeldanalyse (bijvoorbeeld het identificeren van tumoren in scans), autonoom rijden (bijvoorbeeld het herkennen van voetgangers en voertuigen) en visuele inspectie voor kwaliteitscontrole bij de productie.

Natural Language Processing (NLP)

AutoML is ook bezig met het verwerken van natuurlijke taal, waardoor het maken van modellen die menselijke taal begrijpen en verwerken wordt vereenvoudigd.

Veelvoorkomende NLP-use cases die profiteren van AutoML zijn tekstclassificatie (bijvoorbeeld gevoelsanalyse van klantbeoordelingen, onderwerpcategorisatie van artikelen, spamfiltering), naamsaanduiding van entiteiten (die belangrijke entiteiten zoals namen, locaties en organisaties in tekst identificeren) en zelfs aspecten van taalgeneratie of -vertaling.

Met AutoML-hulpprogramma's kunt u het kiezen en afstemmen van verschillende stappen voor tekstvoorverwerking, het insluiten van woorden (zoals Word2Vec of GloVe) en modelarchitecturen (variërend van traditionele modellen tot terugkerende neurale netwerken (RNN's) of transformatoren) automatiseren, waardoor het eenvoudiger wordt om toepassingen te bouwen, zoals chatbots in gebruik, systemen voor het aanbevelen van inhoud en toolsets die zijn gebaseerd op het analyseren van tekstgegevens op grote schaal.

Branchetoepassingen

Naast deze specifieke taakcategorieën biedt het gebruik van AutoML een meerwaarde in een groot aantal sectoren door een snellere en efficiëntere implementatie van op maat gemaakte AI-oplossingen mogelijk te maken:

  • Finance Voor kredietscore, fraudedetectiewetenschap, algoritmische handel en klantrelatiebeheer. AutoML helpt financiële instellingen snel robuuste modellen te bouwen en zich aan te passen aan veranderende marktdynamiek en wettelijke vereisten.
     
  • Healthcare science : In ziektevoorspelling en -diagnose op basis van patiëntengegevens, geneesmiddelendetectie door het analyseren van moleculaire structuren, medische beeldanalyse (zoals vermeld in Computer Vision) en wetenschap voor het personaliseren van behandelingsplannen.
     
  • Retail en E-commerce : Voor vraagprognose met behulp van klantsegmentatie, gepersonaliseerde aanbevelingsengines, churn-voorspelling en dynamische prijsstrategieën.
     
  • Manufacturing science : Bij voorspellend onderhoud om te anticiperen op apparatuurstoringen, kwaliteitscontrole door middel van automatische visuele inspectie, optimalisatiewetenschap van de toeleveringsketen en verbetering van het productieproces.
     
  • Marketing Voor waardevoorspellingen tijdens de levenscyclus van klanten, campagneoptimalisatie, gevoelsanalyse van merkperceptie en scoren van leads.
     
  • Telecommunicatie : Zo kunt u veranderingen bij klanten voorspellen, de netwerkprestaties optimaliseren en frauduleuze activiteiten detecteren.

Beperkingen en uitdagingen van AutoML

Hoewel AutoML aanzienlijke voordelen biedt bij het stroomlijnen van de ontwikkeling van artificiële intelligentie, is het belangrijk om de huidige beperkingen in het gebruik ervan te erkennen, evenals de uitdagingen waarmee gebruikers en ontwikkelaars in het hele proces van data learning geconfronteerd blijven worden.

Inzicht in deze aspecten zorgt voor een realistischer verwachting en effectief gebruik van AutoML-tools.

Interpretatie en transparantie

Een van de meest besproken uitdagingen in AutoML is het potentiële gebrek aan interpretatie en transparantie in de modellen die het produceert.
 

AutoML-systemen gebruiken vaak complexe algo's en creëren geavanceerde ensembles of neurale netwerkarchitecturen die een hoge voorspellende nauwkeurigheid bereiken.
 

Maar juist het dataproces dat tot deze krachtige modellen leidt, kan ze doen functioneren als "black boxes", waarbij het begrijpen van de interne logica of de specifieke redenen achter een bepaalde voorspelling moeilijk wordt.
 

Deze ondoorzichtigheid kan een significante barrière zijn in gereguleerde sectoren als finance of gezondheidszorg, waar verklaarbare artificiële intelligentie (AI) cruciaal is voor compliance, vertrouwen en debugging, en wanneer het verzekeren van eerlijkheid en het identificeren van potentiële vooroordelen van het grootste belang is.

Rekenresources en -kosten

Hoewel AutoML zich richt op het verbeteren van de efficiëntie, kan de onderliggende zoektocht naar optimale pijplijnen, modellen en hyperparameters extreem rekenintensief zijn.
 

Technieken zoals Neural Architecture Search (NAS) of exhaustieve hyperparameteroptimalisatie (HPO) over veel verschillende modeltypen kunnen aanzienlijke verwerkingskracht (CPU's, GPU's, TPU's) en een aanzienlijke uitvoeringstijd vereisen, vooral bij grote datasets.
 

Hoewel op de cloud gebaseerde AutoML-services schaalbare computerresources bieden, kunnen de bijbehorende kosten aanzienlijk worden als ze niet zorgvuldig worden beheerd. Deze resource-vraag kan geavanceerde AutoML-functies soms minder toegankelijk maken voor kleinere organisaties of individuele onderzoekers met beperkte budgetten of infrastructuur.

Reikwijdte van automatisering

Het is essentieel om te erkennen dat AutoML niet de gehele data science en machine learning levenscyclus automatiseert.
 

Kritieke upstream-taken, zoals duidelijke probleemformulering, het definiëren van relevante zakelijke doelstellingen, het verzamelen en verzamelen van hoogwaardige gegevens en een diepgaand begrip van domeinen, vertrouwen nog steeds sterk op menselijke expertise en interventie.
 

Op dezelfde manier vallen de "last mile"-uitdagingen van de implementatie van modellen in complexe productieomgevingen, het zorgen voor naadloze integratie met het bestaande gegevensproces en de bestaande gegevenssystemen, continue controle op conceptdrift en het aanpakken van genuanceerde ethische overwegingen vaak buiten het directe bereik van de huidige AutoML-tools.

OVHcloud en geautomatiseerd machine learning

Ontdek de OVHcloud-services die ontworpen zijn om uw innovatie te stimuleren. Van het implementeren van geavanceerde modellen voor artificiële intelligentie tot het bouwen van schaalbare cloudinfrastructuren: gebruik onze hostingoplossingen om uw projecten tot leven te brengen.

Public Cloud Icon

AI Deploy

Implementeer en beheer uw machine-learningmodellen moeiteloos op grote schaal met AI Deploy. Bedien uw modellen via veilige, schaalbare API-eindpunten zonder u zorgen te hoeven maken over de onderliggende infrastructuur.

Hosted Private cloud Icon

AI machinelearning

Versnel uw volledige machine learning-workflow met onze krachtige en flexibele AI Machine Learning-oplossing. Van gegevensplanning en modeltraining tot implementatie, u krijgt toegang tot een uitgebreide suite van tools en bronnen.

Bare MetaL Icon

Public cloud

Bouw, implementeer en schaal uw applicaties op met vrijheid en controle over OVHcloud Public Cloud. Gebruik ons robuuste en veelzijdige platform, dat een breed scala aan IaaS-, PaaS- en SaaS-oplossingen biedt, waardoor u de cloud-oplossingen krijgt die u voor elk project nodig heeft.