AI endpoints

Acesse facilmente modelos de IA pré-treinados de renome mundial.
Inove com APIs simples e seguras na infraestrutura robusta e confidencial da OVHcloud. Otimize suas aplicações com capacidades de IA escaláveis, eliminando a necessidade de profunda especialização. Ganhe eficiência com poderosos endpoints de IA, projetados para simplicidade e confiabilidade.

Descubra nossos modelos

Explore nosso catálogo de modelos de inteligência artificial para encontrar o que se adapta às suas necessidades.

22 resultados disponíveis

CODE LLM
Novo

Qwen3-Coder-30B-A3B-Instruct

0.06

/Mtoken(entrada)

0.22

/Mtoken(saída)

Licença: Apache 2.0

Número de parâmetros: 30B

Quantificação: fp8

Tamanho máximo do contexto: 256K

Apoio ao cliente: Chamada de função, Code Assistant

Saber mais
REASONING LLM
Novo

Gpt-oss-20b

0.04

/Mtoken(entrada)

0.15

/Mtoken(saída)

Licença: Apache 2.0

Número de parâmetros: 21B

Quantificação: fp4

Tamanho máximo do contexto: 131K

Apoio ao cliente: Chamada de função, Reasoning

Saber mais
REASONING LLM
Novo

Gpt-oss-120b

0.08

/Mtoken(entrada)

0.4

/Mtoken(saída)

Licença: Apache 2.0

Número de parâmetros: 117B

Quantificação: fp4

Tamanho máximo do contexto: 131K

Apoio ao cliente: Chamada de função, Reasoning

Saber mais
AUDIO ANALYSIS
Novo

Whisper-large-v3

0.00004083

/segundo

Licença: Apache 2.0

Número de parâmetros: 1.54B

Quantificação: fp16

Apoio ao cliente: Automatic Speech Recognition

Saber mais
AUDIO ANALYSIS
Novo

Whisper-large-v3-turbo

0.00001278

/segundo

Licença: Apache 2.0

Número de parâmetros: 0.81B

Quantificação: fp16

Apoio ao cliente: Automatic Speech Recognition

Saber mais
REASONING LLM
Novo

Qwen3-32B

0.08

/Mtoken(entrada)

0.23

/Mtoken(saída)

Licença: Apache 2.0

Número de parâmetros: 32.8B

Quantificação: fp8

Tamanho máximo do contexto: 32K

Apoio ao cliente: Chamada de função, Reasoning

Saber mais
VISUAL LLM
Novo

Mistral-Small-3.2-24B-Instruct-2506

0.09

/Mtoken(entrada)

0.28

/Mtoken(saída)

Licença: Apache 2.0

Número de parâmetros: 24B

Quantificação: fp8

Tamanho máximo do contexto: 128K

Apoio ao cliente: Chamada de função, Multimodal

Saber mais
LARGE LANGUAGE MODELS (LLM)
Novo

Llama-3.1-8B-Instruct

0.1

/Mtoken(entrada)

0.1

/Mtoken(saída)

Licença: Llama 3.1 Community

Número de parâmetros: 8B

Quantificação: fp16

Tamanho máximo do contexto: 131K

Apoio ao cliente: Chamada de função

Saber mais
LARGE LANGUAGE MODELS (LLM)
Novo

Meta-Llama-3_3-70B-Instruct

0.67

/Mtoken(entrada)

0.67

/Mtoken(saída)

Licença: Llama 3.3 Community

Número de parâmetros: 70B

Quantificação: fp8

Tamanho máximo do contexto: 131K

Apoio ao cliente: Chamada de função

Saber mais
LARGE LANGUAGE MODELS (LLM)

Mixtral-8x7B-Instruct-v0.1

0.63

/Mtoken(entrada)

0.63

/Mtoken(saída)

Licença: Apache 2.0

Número de parâmetros: 46.7B

Quantificação: fp16

Tamanho máximo do contexto: 32K

Saber mais
LARGE LANGUAGE MODELS (LLM)
Novo

Mistral-7B-Instruct-v0.3

0.1

/Mtoken(entrada)

0.1

/Mtoken(saída)

Licença: Apache 2.0

Número de parâmetros: 7B

Quantificação: fp16

Tamanho máximo do contexto: 127K

Apoio ao cliente: Chamada de função

Saber mais
EMBEDDINGS

Bge-base-en-v1.5

0.01

/Mtoken(entrada)

Licença: MIT

Número de parâmetros: 0.109B

Quantificação: fp16

Saber mais
VISUAL LLM
Novo

Qwen2.5-VL-72B-Instruct

0.91

/Mtoken(entrada)

0.91

/Mtoken(saída)

Licença: Qwen

Número de parâmetros: 72B

Quantificação: fp8

Tamanho máximo do contexto: 32K

Apoio ao cliente: Multimodal

Saber mais
EMBEDDINGS

Bge-multilingual-gemma2

0.01

/Mtoken(entrada)

Licença: Gemma

Número de parâmetros: 0.567B

Quantificação: fp16

Saber mais
REASONING LLM
Novo

DeepSeek-R1-Distill-Llama-70B

0.67

/Mtoken(entrada)

0.67

/Mtoken(saída)

Licença: MIT & Meta Llama 3 Community License

Número de parâmetros: 70B

Quantificação: fp8

Tamanho máximo do contexto: 131K

Apoio ao cliente: Chamada de função, Reasoning

Saber mais
LARGE LANGUAGE MODELS (LLM)

Mistral-Nemo-Instruct-2407

0.13

/Mtoken(entrada)

0.13

/Mtoken(saída)

Licença: Apache 2.0

Número de parâmetros: 12.2B

Quantificação: fp16

Tamanho máximo do contexto: 118K

Apoio ao cliente: Chamada de função

Saber mais
EMBEDDINGS

BGE-M3

0.01

/Mtoken(entrada)

Licença: MIT

Número de parâmetros: 0.567B

Quantificação: fp16

Saber mais
IMAGE GENERATION

Stable-diffusion-xl-base-v10

Grátis

Licença: OpenRail++

Número de parâmetros: 3.5B

Quantificação: fp32

Apoio ao cliente: Image Generation

Saber mais
AUDIO ANALYSIS

Nvr-tts-it-it

Grátis

Licença: Riva license

Número de parâmetros: B

Quantificação: fp32

Apoio ao cliente: Text To Speech

Saber mais
AUDIO ANALYSIS

Nvr-tts-es-es

Grátis

Licença: Riva license

Número de parâmetros: B

Quantificação: fp32

Apoio ao cliente: Text To Speech

Saber mais
AUDIO ANALYSIS

Nvr-tts-en-us

Grátis

Licença: Riva license

Número de parâmetros: B

Quantificação: fp32

Apoio ao cliente: Text To Speech

Saber mais
AUDIO ANALYSIS

Nvr-tts-de-de

Grátis

Licença: Riva license

Número de parâmetros: B

Quantificação: fp32

Apoio ao cliente: Text To Speech

Saber mais