Yepic header
hardware icon

Cerca de 30

instâncias GPU em produção.

play

1 milhão de vídeos

geradas pelo serviço Yepic Studio.

Piggy Bank icon

A sua receita mensal

passou de 2000 para 50 000 dólares em apenas 5 meses.

O contexto

Um robô a acolher visitantes à entrada de um campus ou de uma empresa; um apresentador ultrarrealista a ler no YouTube os resultados trimestrais de um grande grupo; o seu rosto, duplicado ao vivo, a falar em chinês com um interlocutor no outro lado do planeta: é esta a tecnologia oferecida por uma startup muito especial, a Yepic.AI.

Esta tecnologia é conhecida como deepfakes. No entanto, os fundadores da Yepic.AI querem fazer dela não só um instrumento útil para as empresas, como também um novo meio de comunicação capaz de revolucionar o diálogo internacional.

É em 2021 que a startup revela o seu primeiro produto: o serviço online Yepic Studio. Esta ferramenta permite gerar um vídeo a partir de um simples texto. Basta escolher um avatar e introduzir um discurso para dispor, em apenas alguns minutos, de um vídeo de apresentação. E o resultado é inacreditável. O segundo produto, chamado VidVoice, oferece uma tradução vocal simultânea. Portanto, agora já é possível manter uma conversa com qualquer pessoa no mundo sem a ajuda de um intérprete.

Aaron Jones, diretor-geral da Yepic.AI, explica o interesse destas ferramentas pioneiras: «Desenvolvemos ferramentas para ajudar as empresas a comunicarem por vídeo, mas isto é muito mais do que um negócio. O nosso objetivo é otimizar a comunicação à escala mundial e facilitar o acesso à saúde: 25 milhões de americanos não falam inglês. No Reino Unido, quase um milhão de pessoas não falam suficientemente bem a língua para poder aceder a serviços de saúde sem um intérprete. Com a nossa ferramenta, toda a gente pode ter acesso ao conhecimento e a serviços na sua língua materna, e para isso basta falar!»

O desafio

A principal atividade da Yepic.AI é a produção de vídeos. A startup trabalha em estreita colaboração com os melhores especialistas do setor no Reino Unido. Em especial, coopera com o Centre for Vision, Speech and Signal Processing (CVSSP), bem como com investigadores das universidades de Oxford, Warwick, Birmingham e Kingston. Conceber vídeos perfeitamente credíveis e sincronizados com a leitura do texto requer um enorme volume de recursos informáticos. A tecnologia baseia-se em algoritmos de machine learning. Gerar um vídeo em tempo real graças ao serviço VidVoice implica, simultaneamente, utilizar as GPU mais potentes do mercado e dispor do máximo de memória possível.

No entanto, a Yepic.AI é ainda uma startup composta por uma dezena de pessoas. Os seus recursos humanos continuam a ser modestos se comparados com os recursos de que dispõem os gigantes da inteligência artificial (IA) que são o Facebook, a Microsoft ou a DeepMind. Os investigadores eram obrigados a dispor de instrumentos extremamente eficazes mas também muito industrializados. E isto para criar os seus algoritmos de IA, testá-los e pô-los em produção numa infraestrutura GPU fiável e com uma boa performance. Todas estas razões levaram Aaron Jones a recorrer à OVHcloud.

A solução

Se a infraestrutura técnica da Yepic.AI começa a implementar as bases de dados geridas da OVHcloud, a atividade principal da startup assenta nas GPU que lhe disponibilizamos: «Os notebooks AI Notebooks da OVHcloud dão-nos acesso a muito mais memória GPU, em comparação com outros fornecedores de cloud. Para uma empresa cuja atividade se baseia a 100% no Machine Learning, este ponto é absolutamente essencial.» Contrariamente aos outros intervenientes no mercado, a OVHcloud dá acesso à GPU Tesla V100S da NVIDIA (e não à versão V100 «clássica»). A versão V100S oferece 32 GB de memória, ou seja, o dobro da versão V100: «Dispor de 32 GB de memória em vez de 16 GB faz toda a diferença quando se trata de gerar vídeos de 60 imagens por segundo. Todos os dados devem ser armazenados na memória GPU para atingir tal nível de desempenho. É impossível atingir essa qualidade de transmissão se se dispuser de menos memória e se for necessário escrever dados em disco.»

Do mesmo modo, a integração combinada das soluções AI Notebooks e ML Serving da OVHcloud constitui um trunfo precioso para a startup: «Os nossos investigadores podem experimentar, muito rapidamente, novos modelos de IA num ambiente de teste. A arquitetura dos notebooks oferecidos pela OVHcloud permite ajustar velozmente os recursos consumidos. Isto traduz-se em ganhos significativos em termos de custos de funcionamento e de produtividade para a nossa equipa.» O fundador da Yepic.AI considera que o ganho de produtividade triplicou, se não mesmo quadruplicou. Com efeito, confiar num serviço gerido pela OVHcloud simplifica consideravelmente a gestão das diferentes versões das bibliotecas CUDA, TensorFlow e PyTorch: «A gestão das versões das frameworks constitui um verdadeiro problema. Para dar o exemplo do PyTorch, cada nova versão traz o seu lote de diferenças e de incompatibilidades. É necessário poder executar as versões do PyTorch com as quais o código foi escrito. Graças à noção de containers e à arquitetura AI Notebooks da OVHcloud, é relativamente simples fazê-lo. Dispor de bons containers é um fator-chave para oferecer rapidamente os serviços aos nossos clientes.»

 

Yepic.AI diagrama

 

O resultado

Mais do que nunca, a startup londrina aposta nas infraestruturas da OVHcloud para assegurar a promoção e a utilização dos seus serviços, bem como a sua evolução. O Yepic Studio está a ser utilizado para criar vídeos de formação, de integração de novos colaboradores ou ainda de acolhimento. A OVHcloud é um dos primeiros utilizadores a partilhar informações com os membros do seu programa de acompanhamento de startups. As vendas deste produto estão a crescer rapidamente, e já foi ultrapassada a barra do milhão de vídeos gerados.

O VidVoice, serviço de tradução simultânea em vídeo no Skype, está atualmente disponível apenas em versão beta junto de algumas empresas. O grupo AstraZeneca, por exemplo, utiliza-o nos seus 21 centros de investigação espalhados por todo o mundo: «O nosso próximo desafio é disponibilizar o serviço ao público e ligar muito mais empresas», explica Aaron Jones. «Vamos integrar novas línguas, mas também oferecer o serviço em novas áreas geográficas. A infraestrutura mundial da OVHcloud deverá permitir-nos lançar a nossa solução em muitos países.» O lançamento global do serviço está previsto para junho de 2022.

O Marketplace da OVHcloud constitui outra vantagem para a Yepic.AI. De facto, esta permite à startup londrina alargar a sua clientela: «Esperamos que as empresas de produção de vídeo possam utilizar as nossas API para produzir conteúdos. À semelhança do serviço Yepic Studio, desejamos que o Vidvoice possa responder a múltiplos casos de uso e assim facilitar a comunicação no mundo», conclui o fundador da Yepic.AI.

 

«Depois de ter colaborado com os gigantes americanos, a OVHcloud é certamente o serviço cloud que nos pareceu mais acessível. Em poucos dias, toda a equipa estava plenamente operacional, possibilitando que os nossos investigadores inovem mais rapidamente. A infraestrutura de produção fornecida pela OVHcloud permite-nos contar com as GPU de melhor desempenho, o que é absolutamente crítico para a nossa atividade.»
Aaron Jones, diretor-geral da Yepic.AI