O que é o Automated Machine Learning?
O objetivo principal do machine learning automático (AutoML) é simplificar e acelerar o processo de construção e implementação de modelos de machine learning, automatizando várias etapas do pipeline de machine learning.

O que é o Automated Machine Learning (AutoML)?
O Machine Learning automatizado, também conhecido como AutoML, é o processo de automatização de tarefas end-to-end envolvidas na construção, treinamento e implementação de modelos de machine learning.
Engloba uma gama de técnicas de fluxo de trabalho e de conjuntos de ferramentas de machine learning concebidos para tornar a aplicação do machine learning mais simples e eficaz. Em vez de depender de cientistas de dados para realizar manualmente cada etapa - desde o pré-processamento de dados, engenharia de funcionalidades e seleção de funcionalidades, até à seleção de algoritmos e à otimização de hiperparâmetros - os sistemas AutoML têm como objetivo automatizar estes processos, muitas vezes demorados e complexos.
Isto permite a criação de algoritmos eficazes de machine learning com uma intervenção humana mínima, abrindo a potência do machine learning a um público mais vasto.
Principais objetivos do AutoML
O desenvolvimento e a adoção do AutoML são orientados por vários objetivos chave:
- Acessibilidade Um dos objetivos principais é democratizar o aprendizado supervisionado por máquinas, tornando-o acessível a indivíduos que possam não possuir uma experiência aprofundada em treinamento ou programação de data science. Isto inclui especialistas em domínios, analistas de negócios e programadores que podem utilizar as ferramentas da AutoML para construir os seus projetos consoante necessidades específicas.
- Eficiência e produtividade: O AutoML tem como objetivo aumentar significativamente a produtividade dos data scientists através da automatização de etapas e tarefas repetitivas e trabalhosas de ML. Isto liberta-lhes tempo para se concentrarem em aspetos mais estratégicos de um projeto, como a formulação de problemas, a interpretação de dados e a comunicação de resultados.
- Desempenho: Ao explorar sistematicamente uma vasta gama de arquiteturas e hiperparâmetros, a AutoML pode frequentemente identificar modelos de elevado desempenho que podem ser negligenciados numa pesquisa manual. O objetivo é atingir uma precisão preditiva e robustez ideais.
- Velocidade. A automatização do pipeline de desenvolvimento de modelos acelera o tempo necessário para passar de dados brutos para um modelo implementável no pipeline de machine learning. Isto é crucial em ambientes com um ritmo acelerado, nos quais são necessárias informações e soluções rápidas.
As ferramentas AutoML também permitem assegurar a reprodutibilidade dos MLOps, através da padronização do processo e do seguimento das configurações e das diligências para construir um modelo.
Simplifica a escalabilidade das aplicações de machine learning dentro de uma organização, permitindo a construção e a manutenção de mais modelos com menos recursos. O AutoML pode fornecer uma linha de base para o desempenho do modelo, em comparação com os modelos desenvolvidos manualmente.
Porquê Automatizar O Machine Learning?
O objetivo de automatizar o treino automático decorre das complexidades inerentes e das exigências do fluxo de trabalho tradicional do machine learning, juntamente com as vantagens significativas que a automatização pode trazer. A compreensão destes aspetos realça a proposta de valor do machine learning automatizado.
Desafios do Machine Learning Tradicional
Tradicionalmente, o desenvolvimento do machine learning é um processo altamente iterativo e muitas vezes árduo, repleto de vários desafios:
- Demorada e consumidora de recursos: O percurso desde dados brutos até um modelo que pode ser implementado envolve várias etapas, incluindo a limpeza de dados, o pré-processamento, a engenharia de funcionalidades, a seleção de modelos, a otimização de hiperparâmetros e a validação. Cada uma destas fases pode requerer tempo considerável e recursos computacionais. A engenharia de características e a otimização de hiperparâmetros, em particular, são reconhecidamente trabalhosas.
- Necessita de conhecimentos especializados: Geralmente, para ser eficaz, a aprendizagem automática necessita de uma compreensão aprofundada de vários algoritmos, princípios estatísticos, técnicas de tratamento de dados e competências de programação. Os especialistas nestas áreas (data scientists, engenheiros de machine learning) são escassos e, por isso, caros.
- Complexidade da seleção e afinação do modelo: Com uma vasta gama de algoritmos disponíveis para treino e um espaço ainda maior de possíveis configurações de hiperparâmetros para cada um, a seleção da combinação ideal para um determinado problema pode ser incrivelmente desafiante. Muitas vezes, envolve uma quantidade significativa de tentativa e erro, baseando-se fortemente na experiência e intuição do cientista de dados.
- Dificuldade de reprodução e de evolução: Garantir a reprodutibilidade dos resultados pode ser difícil se o processo de dados não for meticulosamente documentado e normalizado. A escalabilidade dos esforços manuais em vários projetos ou em conjuntos de dados de maior dimensão também apresenta obstáculos significativos.
Também é verdade que um fluxo de trabalho manual é suscetível a erros humanos e tendências cognitivas, o que pode inadvertidamente influenciar a seleção ou avaliação de modelos, levando a resultados abaixo do ótimo ou injustos.
Vantagens da automatização
Automatizar o machine learning oferece soluções atraentes para estes desafios e traz inúmeras vantagens:
- Maior rapidez e eficácia: O AutoML acelera significativamente o ciclo de vida de desenvolvimento dos modelos. Ao automatizar tarefas repetitivas como a otimização de hiperparâmetros e a seleção de modelos, permite uma iteração e uma experimentação muito mais rápidas, reduzindo o tempo de comercialização das soluções ML.
- Produtividade melhorada Os cientistas de dados podem descarregar muitos dos aspetos mais fastidiosos da construção de modelos para sistemas AutoML. Isto liberta-os para se concentrarem em atividades de maior valor, como a formulação de problemas, a compreensão das necessidades das empresas, a interpretação dos resultados e a garantia de uma implementação ética da inteligência artificial.
- Democratização do machine learning: As ferramentas da AutoML reduzem a barreira de entrada, permitindo que indivíduos com conhecimentos menos especializados, como especialistas em domínios, analistas de negócios e programadores de software, construam e utilizem eficazmente modelos de machine learning. Isto ajuda a integrar capacidades de inteligência artificial de um modo mais geral numa organização.
Ao explorar sistematicamente uma gama mais vasta de algoritmos para o treino, técnicas de processamento de funcionalidades e definições de hiperparâmetros do que é normalmente possível através de esforços manuais, a AutoML pode muitas vezes descobrir modelos que utilizam um desempenho e uma generalização superiores.
Como funciona o AutoML?
Os sistemas AutoML funcionam através da automatização inteligente das diferentes etapas do processo tradicional de machine learning. Utilizam uma combinação de técnicas estabelecidas e de investigação de ponta para procurar o vasto espaço de soluções de treino possíveis, com o objetivo de encontrar o modelo ideal para um determinado conjunto de dados e tarefa, com uma intervenção humana mínima.
Passos do Pipeline ML Automatizado
O AutoML simplifica a transição dos dados brutos para um modelo otimizado, automatizando uma sequência de passos críticos no pipeline de machine learning.
Geralmente, isto começa com a ingestão de dados e o pré-processamento essencial, seguido de uma seleção automatizada sofisticada para preparar os dados para a modelação.
De seguida, o sistema explora de forma inteligente vários algoritmos de machine learning adequados e, sobretudo, utiliza a otimização automatizada de hiperparâmetros para afinar o seu desempenho.
Tecnologias de Aprendizagem Básicas no AutoML
O motor que utiliza as capacidades da AutoML baseia-se num conjunto diversificado de tecnologias de base. Entre estes destacam-se os algoritmos avançados de otimização de hiperparâmetros—tais como a otimização Bayesiana, algoritmos evolutivos e métodos de pesquisa mais simples—que encontram de forma eficiente as melhores configurações de modelo.
Para o "deep learning", a utilização da Procura pela Arquitetura Neuronal (NAS) automatiza a conceção de redes neurais complexas. A meta-aprendizagem permite aos sistemas aprender a partir de experiências passadas para enfrentar novas tarefas de forma mais eficaz.
Além disso, a utilização de métodos de ensemble automatizados combina estrategicamente vários modelos de aprendizagem, enquanto as técnicas especializadas automatizam a criação de funcionalidades e a construção e otimização globais de todo o processo de machine learning, o que significa, coletivamente, a utilização de uma geração de modelos eficiente e eficaz.
Casos de uso mais comuns do ML automático
O Machine Learning automatizado encontrou aplicações práticas numa vasta gama de tipos de problemas e indústrias, acelerando a implementação de soluções de IA e possibilitando novas possibilidades.
A sua capacidade de agilizar um processo de dados complexo torna-o inestimável para tarefas de machine learning comuns, bem como para domínios mais especializados em que funciona na utilização real.
Classificação e Regressão
A classificação e a regressão são são tarefas fundamentais de aprendizagem supervisionadas, nas quais o AutoML brilha particularmente.
Para os problemas de classificação, que envolvem a predição de um rótulo categórico (por exemplo, spam ou não spam, alterações de clientes ou ausência de agitação, diagnósticos médicos), os sistemas Auto ML podem testar rapidamente vários algos como a regressão logística, apoiar máquinas vetoriais, árvores de decisões e métodos de ensemble, além de utilizar uma engenharia de funcionalidades extensiva e de sintonização de hiperparâmetros, para construir classificadores altamente precisos.
Do mesmo modo, para as tarefas de regressão, que visam prever um valor numérico contínuo (por exemplo, preços das casas, valores dos stocks, previsões de vendas, temperatura), o Auto ML automatiza o processo de encontrar os modelos mais adequados, tratamento da escalabilidade das funcionalidades e as transformações para otimizar o desempenho em métricas como o Mean Squared Error ou o R-squared.
Assim, as organizações podem utilizar rapidamente ferramentas de deteção de fraudes, de avaliação de riscos, de previsão da procura e de marketing personalizado.
Visão computacional
No campo da visão computacional, a solução AutoML é cada vez mais utilizada para realizar tarefas que, tradicionalmente, requerem uma experiência aprofundada no processamento de imagens e no design de redes neurais.
O ML automático, especialmente graças a técnicas como a Procura de Arquitetura Neuronal (NAS) e a aprendizagem de transferência automática com modelos pré-treinados, contribui para a conceção e otimização automáticas de redes neurais convolucionais (CNN) para tarefas como a classificação de imagens (por exemplo, identificação de objetos em imagens), a deteção de objetos (localização e categorização de vários objetos numa imagem) e a segmentação de imagens (particionamento de uma imagem em segmentos significativos).
Isto permite um desenvolvimento mais rápido de aplicações baseadas em áreas como a análise de imagens médicas (por exemplo, identificação de tumores em exames), condução autónoma (por exemplo, reconhecimento de peões e veículos), e inspeção visual para controle de qualidade na fabricação.
Processamento de Linguagem Natural (PLN)
A AutoML também contribui de forma significativa para o Processamento da Linguagem Natural, simplificando a criação de modelos que compreendam e processem a linguagem humana.
Os casos de uso mais comuns do PLN que beneficiam do AutoML incluem a classificação de texto (por exemplo, análise de sentimento de opiniões de clientes, categorização de tópicos de artigos, filtragem de spam), o reconhecimento de entidades nomeadas (identificação de entidades-chave como nomes, localizações e organizações em texto) e ainda aspetos de geração de linguagem ou tradução.
A utilização de ferramentas AutoML permite automatizar a escolha e a afinação de vários passos de pré-processamento de texto, incorporações de palavras (como Word2Vec ou GloVe) e arquiteturas de modelos (desde modelos tradicionais a redes neurais recorrentes (RNN) ou transformadores), simplificando a criação de aplicações como chatbots em uso, sistemas de recomendação de conteúdos e conjuntos de ferramentas baseados na análise de dados textuais à escala.
Aplicações da indústria
Para além destas categorias de tarefas específicas, a utilização de drives AutoML em várias indústrias permite uma implementação mais rápida e eficaz de soluções de IA personalizadas:
- Finanças Para a classificação de crédito, a ciência da deteção de fraudes, a negociação algorítmica e a gestão da relação com os clientes. A AutoML ajuda as instituições financeiras a construir modelos robustos de forma rápida, ao mesmo tempo que se adapta às mudanças da dinâmica do mercado e dos requisitos regulatórios.
- Healthcare science: Na previsão e diagnóstico de doenças a partir de dados de pacientes, descoberta de medicamentos através da análise de estruturas moleculares, análise de imagem médica (como mencionado em Computer Vision), e ciência para personalizar planos de tratamento.
- Venda a retalho e E-commerce: Para a previsão da procura, utilizando a segmentação de clientes, motores de recomendação personalizados, previsão de falhas e estratégias dinâmicas de fixação de preços.
- Manufacturing science: Em manutenção preditiva para antecipar falhas de equipamentos, controle de qualidade por meio de autoinspeção visual, ciência da otimização da cadeia de fornecimento e melhoria do processo de produção.
- Marketing Para a previsão do valor de vida do cliente, otimização da campanha, análise de sentimento da perceção da marca e pontuação de chumbo.
- Telecomunicações: Para prever a perda de clientes, otimizar o desempenho da rede e detetar atividades fraudulentas.
Limitações e Desafios do AutoML
Embora o AutoML ofereça vantagens significativas na otimização do desenvolvimento da inteligência artificial, é importante reconhecer as suas atuais limitações na utilização e os desafios que os utilizadores e programadores continuam a enfrentar ao longo de todo o processo de aprendizagem dos dados.
A compreensão destes aspetos possibilita uma expetativa mais realista e uma utilização eficaz das ferramentas AutoML.
Interpretação e transparência
Um dos desafios mais discutidos no AutoML é a potencial falta de interpretação e transparência nos modelos que produz.
Os sistemas AutoML costumam utilizar algos complexos e criar conjuntos sofisticados ou arquiteturas de rede neural que permitem uma elevada precisão preditiva.
No entanto, o próprio processo de dados que leva a estes modelos de alto desempenho pode fazê-los funcionar como "caixas negras", onde compreender a lógica interna ou as razões específicas por trás de uma previsão em particular se torna difícil.
Esta opacidade pode ser uma barreira significativa em indústrias regulamentadas, como as finanças ou os cuidados de saúde, onde a inteligência artificial explicável (XAI) é fundamental para a conformidade, a confiança e a depuração, e quando é primordial assegurar a equidade e identificar potenciais preconceitos.
Recursos e custos computacionais
Embora o objetivo da AutoML seja melhorar a eficiência, a procura subjacente de tubagens, modelos e hiperparâmetros ideais pode revelar-se extremamente intensiva do ponto de vista computacional.
Técnicas como a Procura de Arquitetura Neuronal (NAS) ou a otimização exaustiva de hiperparâmetros (HPO) em diferentes tipos de modelos podem requerer uma potência de processamento substancial (CPUs, GPUs, TPUs) e um tempo considerável para serem executadas, especialmente se tiverem grandes conjuntos de dados.
Embora os serviços AutoML baseados na cloud ofereçam recursos de computação escaláveis, os custos associados podem tornar-se significativos se não forem cuidadosamente geridos. Esta procura de recursos pode por vezes tornar as funcionalidades AutoML avançadas menos acessíveis para organizações de menor dimensão ou investigadores individuais com orçamentos limitados ou infraestruturas.
Âmbito da automatização
É crucial reconhecer que o AutoML não automatiza todo o ciclo de vida da data science e do machine learning.
As tarefas essenciais a montante, como a formulação clara dos problemas, a definição dos objetivos empresariais pertinentes, a aquisição e a recolha de dados de alta qualidade e a compreensão aprofundada dos domínios, contam ainda com a experiência e a intervenção humanas.
Do mesmo modo, os desafios da "última milha" de implementar modelos em ambientes de produção complexos, garantindo uma integração sem falhas com o processo e os sistemas de dados existentes, uma monitorização contínua da deriva do conceito e abordando questões éticas matizadas, estão muitas vezes fora do âmbito direto das ferramentas AutoML atuais.
OVHcloud e machine learning automatizado
Descubra os serviços da OVHcloud concebidos para impulsionar a sua inovação. Desde a implementação de modelos de inteligência artificial inovadores à construção de infraestruturas cloud escaláveis, utilize as nossas soluções de alojamento para dar vida aos seus projetos.

AI Deploy
Implemente e gira facilmente os seus modelos de machine learning à escala com o AI Deploy. Sirva os seus modelos através de pontos finais da API seguros e escaláveis sem se preocupar com a infraestrutura subjacente.

IA & Machine Learning
Acelere todo o seu fluxo de trabalho de machine learning com a nossa potente e flexível solução AI Machine Learning. Desde a preparação dos dados e a formação de modelos até à implementação, tenha acesso a um conjunto completo de ferramentas e recursos.

Cloud pública
Construa, implemente e escale as suas aplicações com liberdade e controlo no Public Cloud da OVHcloud. Utilize a nossa plataforma robusta e versátil, que oferece uma vasta gama de soluções IaaS, PaaS e SaaS, oferecendo-lhe as soluções cloud de que precisa para qualquer projeto.