Endpoint AI

Accedi facilmente a modelli AI pre-addestrati di fama mondiale.
Innova con API semplici e sicure sull'infrastruttura robusta e riservata di OVHcloud. Ottimizza le tue applicazioni con capacità AI scalabili, eliminando la necessità di una profonda esperienza. Ottieni efficienza con potenti endpoint AI, progettati per semplicità e affidabilità.

Scopri i nostri modelli

Esplora il nostro catalogo di modelli di intelligenza artificiale per trovare quello che soddisfa le tue esigenze.

22 risultati disponibili

CODE LLM
Novità

Qwen3-Coder-30B-A3B-Instruct

0.06

/Mtoken(input)

0.22

/Mtoken(output)

Licenza: Apache 2.0

Numero di parametri: 30B

Quantizzazione: fp8

Dimensione massima del contesto: 256K

Supporto: Chiamata di funzione, Code Assistant

Scopri di più
REASONING LLM
Novità

Gpt-oss-20b

0.04

/Mtoken(input)

0.15

/Mtoken(output)

Licenza: Apache 2.0

Numero di parametri: 21B

Quantizzazione: fp4

Dimensione massima del contesto: 131K

Supporto: Chiamata di funzione, Reasoning

Scopri di più
REASONING LLM
Novità

Gpt-oss-120b

0.08

/Mtoken(input)

0.4

/Mtoken(output)

Licenza: Apache 2.0

Numero di parametri: 117B

Quantizzazione: fp4

Dimensione massima del contesto: 131K

Supporto: Chiamata di funzione, Reasoning

Scopri di più
AUDIO ANALYSIS
Novità

Whisper-large-v3

0.00004083

/secondo

Licenza: Apache 2.0

Numero di parametri: 1.54B

Quantizzazione: fp16

Supporto: Automatic Speech Recognition

Scopri di più
AUDIO ANALYSIS
Novità

Whisper-large-v3-turbo

0.00001278

/secondo

Licenza: Apache 2.0

Numero di parametri: 0.81B

Quantizzazione: fp16

Supporto: Automatic Speech Recognition

Scopri di più
REASONING LLM
Novità

Qwen3-32B

0.08

/Mtoken(input)

0.23

/Mtoken(output)

Licenza: Apache 2.0

Numero di parametri: 32.8B

Quantizzazione: fp8

Dimensione massima del contesto: 32K

Supporto: Chiamata di funzione, Reasoning

Scopri di più
VISUAL LLM
Novità

Mistral-Small-3.2-24B-Instruct-2506

0.09

/Mtoken(input)

0.28

/Mtoken(output)

Licenza: Apache 2.0

Numero di parametri: 24B

Quantizzazione: fp8

Dimensione massima del contesto: 128K

Supporto: Chiamata di funzione, Multimodal

Scopri di più
LARGE LANGUAGE MODELS (LLM)
Novità

Llama-3.1-8B-Instruct

0.1

/Mtoken(input)

0.1

/Mtoken(output)

Licenza: Llama 3.1 Community

Numero di parametri: 8B

Quantizzazione: fp16

Dimensione massima del contesto: 131K

Supporto: Chiamata di funzione

Scopri di più
LARGE LANGUAGE MODELS (LLM)
Novità

Meta-Llama-3_3-70B-Instruct

0.67

/Mtoken(input)

0.67

/Mtoken(output)

Licenza: Llama 3.3 Community

Numero di parametri: 70B

Quantizzazione: fp8

Dimensione massima del contesto: 131K

Supporto: Chiamata di funzione

Scopri di più
LARGE LANGUAGE MODELS (LLM)

Mixtral-8x7B-Instruct-v0.1

0.63

/Mtoken(input)

0.63

/Mtoken(output)

Licenza: Apache 2.0

Numero di parametri: 46.7B

Quantizzazione: fp16

Dimensione massima del contesto: 32K

Scopri di più
LARGE LANGUAGE MODELS (LLM)
Novità

Mistral-7B-Instruct-v0.3

0.1

/Mtoken(input)

0.1

/Mtoken(output)

Licenza: Apache 2.0

Numero di parametri: 7B

Quantizzazione: fp16

Dimensione massima del contesto: 127K

Supporto: Chiamata di funzione

Scopri di più
EMBEDDINGS

Bge-base-en-v1.5

0.01

/Mtoken(input)

Licenza: MIT

Numero di parametri: 0.109B

Quantizzazione: fp16

Scopri di più
VISUAL LLM
Novità

Qwen2.5-VL-72B-Instruct

0.91

/Mtoken(input)

0.91

/Mtoken(output)

Licenza: Qwen

Numero di parametri: 72B

Quantizzazione: fp8

Dimensione massima del contesto: 32K

Supporto: Multimodal

Scopri di più
EMBEDDINGS

Bge-multilingual-gemma2

0.01

/Mtoken(input)

Licenza: Gemma

Numero di parametri: 0.567B

Quantizzazione: fp16

Scopri di più
REASONING LLM
Novità

DeepSeek-R1-Distill-Llama-70B

0.67

/Mtoken(input)

0.67

/Mtoken(output)

Licenza: MIT & Meta Llama 3 Community License

Numero di parametri: 70B

Quantizzazione: fp8

Dimensione massima del contesto: 131K

Supporto: Chiamata di funzione, Reasoning

Scopri di più
LARGE LANGUAGE MODELS (LLM)

Mistral-Nemo-Instruct-2407

0.13

/Mtoken(input)

0.13

/Mtoken(output)

Licenza: Apache 2.0

Numero di parametri: 12.2B

Quantizzazione: fp16

Dimensione massima del contesto: 118K

Supporto: Chiamata di funzione

Scopri di più
EMBEDDINGS

BGE-M3

0.01

/Mtoken(input)

Licenza: MIT

Numero di parametri: 0.567B

Quantizzazione: fp16

Scopri di più
IMAGE GENERATION

Stable-diffusion-xl-base-v10

Gratis

Licenza: OpenRail++

Numero di parametri: 3.5B

Quantizzazione: fp32

Supporto: Image Generation

Scopri di più
AUDIO ANALYSIS

Nvr-tts-it-it

Gratis

Licenza: Riva license

Numero di parametri: B

Quantizzazione: fp32

Supporto: Text To Speech

Scopri di più
AUDIO ANALYSIS

Nvr-tts-es-es

Gratis

Licenza: Riva license

Numero di parametri: B

Quantizzazione: fp32

Supporto: Text To Speech

Scopri di più
AUDIO ANALYSIS

Nvr-tts-en-us

Gratis

Licenza: Riva license

Numero di parametri: B

Quantizzazione: fp32

Supporto: Text To Speech

Scopri di più
AUDIO ANALYSIS

Nvr-tts-de-de

Gratis

Licenza: Riva license

Numero di parametri: B

Quantizzazione: fp32

Supporto: Text To Speech

Scopri di più