AI endpoints
Acesse facilmente modelos de IA pré-treinados de renome mundial.
Inove com APIs simples e seguras na infraestrutura robusta e confidencial da OVHcloud. Otimize suas aplicações com capacidades de IA escaláveis, eliminando a necessidade de profunda especialização. Ganhe eficiência com poderosos endpoints de IA, projetados para simplicidade e confiabilidade.
Descubra nossos modelos
Explore nosso catálogo de modelos de inteligência artificial para encontrar o que se adapta às suas necessidades.
Filtros
Contexto
Selected value: Todos
22 resultados disponíveis
Qwen3-Coder-30B-A3B-Instruct
0.06€
/Mtoken(entrada)0.22€
/Mtoken(saída)Licença: Apache 2.0
Número de parâmetros: 30B
Quantificação: fp8
Tamanho máximo do contexto: 256K
Apoio ao cliente: Chamada de função, Code Assistant
Gpt-oss-20b
0.04€
/Mtoken(entrada)0.15€
/Mtoken(saída)Licença: Apache 2.0
Número de parâmetros: 21B
Quantificação: fp4
Tamanho máximo do contexto: 131K
Apoio ao cliente: Chamada de função, Reasoning
Gpt-oss-120b
0.08€
/Mtoken(entrada)0.4€
/Mtoken(saída)Licença: Apache 2.0
Número de parâmetros: 117B
Quantificação: fp4
Tamanho máximo do contexto: 131K
Apoio ao cliente: Chamada de função, Reasoning
Whisper-large-v3
0.00004083€
/segundoLicença: Apache 2.0
Número de parâmetros: 1.54B
Quantificação: fp16
Apoio ao cliente: Automatic Speech Recognition
Whisper-large-v3-turbo
0.00001278€
/segundoLicença: Apache 2.0
Número de parâmetros: 0.81B
Quantificação: fp16
Apoio ao cliente: Automatic Speech Recognition
Qwen3-32B
0.08€
/Mtoken(entrada)0.23€
/Mtoken(saída)Licença: Apache 2.0
Número de parâmetros: 32.8B
Quantificação: fp8
Tamanho máximo do contexto: 32K
Apoio ao cliente: Chamada de função, Reasoning
Mistral-Small-3.2-24B-Instruct-2506
0.09€
/Mtoken(entrada)0.28€
/Mtoken(saída)Licença: Apache 2.0
Número de parâmetros: 24B
Quantificação: fp8
Tamanho máximo do contexto: 128K
Apoio ao cliente: Chamada de função, Multimodal
Llama-3.1-8B-Instruct
0.1€
/Mtoken(entrada)0.1€
/Mtoken(saída)Licença: Llama 3.1 Community
Número de parâmetros: 8B
Quantificação: fp16
Tamanho máximo do contexto: 131K
Apoio ao cliente: Chamada de função
Meta-Llama-3_3-70B-Instruct
0.67€
/Mtoken(entrada)0.67€
/Mtoken(saída)Licença: Llama 3.3 Community
Número de parâmetros: 70B
Quantificação: fp8
Tamanho máximo do contexto: 131K
Apoio ao cliente: Chamada de função
Mixtral-8x7B-Instruct-v0.1
0.63€
/Mtoken(entrada)0.63€
/Mtoken(saída)Licença: Apache 2.0
Número de parâmetros: 46.7B
Quantificação: fp16
Tamanho máximo do contexto: 32K
Mistral-7B-Instruct-v0.3
0.1€
/Mtoken(entrada)0.1€
/Mtoken(saída)Licença: Apache 2.0
Número de parâmetros: 7B
Quantificação: fp16
Tamanho máximo do contexto: 127K
Apoio ao cliente: Chamada de função
Bge-base-en-v1.5
0.01€
/Mtoken(entrada)Qwen2.5-VL-72B-Instruct
0.91€
/Mtoken(entrada)0.91€
/Mtoken(saída)Licença: Qwen
Número de parâmetros: 72B
Quantificação: fp8
Tamanho máximo do contexto: 32K
Apoio ao cliente: Multimodal
Bge-multilingual-gemma2
0.01€
/Mtoken(entrada)DeepSeek-R1-Distill-Llama-70B
0.67€
/Mtoken(entrada)0.67€
/Mtoken(saída)Licença: MIT & Meta Llama 3 Community License
Número de parâmetros: 70B
Quantificação: fp8
Tamanho máximo do contexto: 131K
Apoio ao cliente: Chamada de função, Reasoning
Mistral-Nemo-Instruct-2407
0.13€
/Mtoken(entrada)0.13€
/Mtoken(saída)Licença: Apache 2.0
Número de parâmetros: 12.2B
Quantificação: fp16
Tamanho máximo do contexto: 118K
Apoio ao cliente: Chamada de função
BGE-M3
0.01€
/Mtoken(entrada)Stable-diffusion-xl-base-v10
Grátis
Licença: OpenRail++
Número de parâmetros: 3.5B
Quantificação: fp32
Apoio ao cliente: Image Generation
Nvr-tts-it-it
Grátis
Licença: Riva license
Número de parâmetros: B
Quantificação: fp32
Apoio ao cliente: Text To Speech
Nvr-tts-es-es
Grátis
Licença: Riva license
Número de parâmetros: B
Quantificação: fp32
Apoio ao cliente: Text To Speech
Nvr-tts-en-us
Grátis
Licença: Riva license
Número de parâmetros: B
Quantificação: fp32
Apoio ao cliente: Text To Speech
Nvr-tts-de-de
Grátis
Licença: Riva license
Número de parâmetros: B
Quantificação: fp32
Apoio ao cliente: Text To Speech