Endpoint AI
Accedi facilmente a modelli AI pre-addestrati di fama mondiale.
Innova con API semplici e sicure sull'infrastruttura robusta e riservata di OVHcloud. Ottimizza le tue applicazioni con capacità AI scalabili, eliminando la necessità di una profonda esperienza. Ottieni efficienza con potenti endpoint AI, progettati per semplicità e affidabilità.
Scopri i nostri modelli
Esplora il nostro catalogo di modelli di intelligenza artificiale per trovare quello che soddisfa le tue esigenze.
Filtri
Contesto
Selected value: Tutto
22 risultati disponibili
Qwen3-Coder-30B-A3B-Instruct
0.06€
/Mtoken(input)0.22€
/Mtoken(output)Licenza: Apache 2.0
Numero di parametri: 30B
Quantizzazione: fp8
Dimensione massima del contesto: 256K
Supporto: Chiamata di funzione, Code Assistant
Gpt-oss-20b
0.04€
/Mtoken(input)0.15€
/Mtoken(output)Licenza: Apache 2.0
Numero di parametri: 21B
Quantizzazione: fp4
Dimensione massima del contesto: 131K
Supporto: Chiamata di funzione, Reasoning
Gpt-oss-120b
0.08€
/Mtoken(input)0.4€
/Mtoken(output)Licenza: Apache 2.0
Numero di parametri: 117B
Quantizzazione: fp4
Dimensione massima del contesto: 131K
Supporto: Chiamata di funzione, Reasoning
Whisper-large-v3
0.00004083€
/secondoLicenza: Apache 2.0
Numero di parametri: 1.54B
Quantizzazione: fp16
Supporto: Automatic Speech Recognition
Whisper-large-v3-turbo
0.00001278€
/secondoLicenza: Apache 2.0
Numero di parametri: 0.81B
Quantizzazione: fp16
Supporto: Automatic Speech Recognition
Qwen3-32B
0.08€
/Mtoken(input)0.23€
/Mtoken(output)Licenza: Apache 2.0
Numero di parametri: 32.8B
Quantizzazione: fp8
Dimensione massima del contesto: 32K
Supporto: Chiamata di funzione, Reasoning
Mistral-Small-3.2-24B-Instruct-2506
0.09€
/Mtoken(input)0.28€
/Mtoken(output)Licenza: Apache 2.0
Numero di parametri: 24B
Quantizzazione: fp8
Dimensione massima del contesto: 128K
Supporto: Chiamata di funzione, Multimodal
Llama-3.1-8B-Instruct
0.1€
/Mtoken(input)0.1€
/Mtoken(output)Licenza: Llama 3.1 Community
Numero di parametri: 8B
Quantizzazione: fp16
Dimensione massima del contesto: 131K
Supporto: Chiamata di funzione
Meta-Llama-3_3-70B-Instruct
0.67€
/Mtoken(input)0.67€
/Mtoken(output)Licenza: Llama 3.3 Community
Numero di parametri: 70B
Quantizzazione: fp8
Dimensione massima del contesto: 131K
Supporto: Chiamata di funzione
Mixtral-8x7B-Instruct-v0.1
0.63€
/Mtoken(input)0.63€
/Mtoken(output)Licenza: Apache 2.0
Numero di parametri: 46.7B
Quantizzazione: fp16
Dimensione massima del contesto: 32K
Mistral-7B-Instruct-v0.3
0.1€
/Mtoken(input)0.1€
/Mtoken(output)Licenza: Apache 2.0
Numero di parametri: 7B
Quantizzazione: fp16
Dimensione massima del contesto: 127K
Supporto: Chiamata di funzione
Bge-base-en-v1.5
0.01€
/Mtoken(input)Qwen2.5-VL-72B-Instruct
0.91€
/Mtoken(input)0.91€
/Mtoken(output)Licenza: Qwen
Numero di parametri: 72B
Quantizzazione: fp8
Dimensione massima del contesto: 32K
Supporto: Multimodal
Bge-multilingual-gemma2
0.01€
/Mtoken(input)DeepSeek-R1-Distill-Llama-70B
0.67€
/Mtoken(input)0.67€
/Mtoken(output)Licenza: MIT & Meta Llama 3 Community License
Numero di parametri: 70B
Quantizzazione: fp8
Dimensione massima del contesto: 131K
Supporto: Chiamata di funzione, Reasoning
Mistral-Nemo-Instruct-2407
0.13€
/Mtoken(input)0.13€
/Mtoken(output)Licenza: Apache 2.0
Numero di parametri: 12.2B
Quantizzazione: fp16
Dimensione massima del contesto: 118K
Supporto: Chiamata di funzione
BGE-M3
0.01€
/Mtoken(input)Stable-diffusion-xl-base-v10
Gratis
Licenza: OpenRail++
Numero di parametri: 3.5B
Quantizzazione: fp32
Supporto: Image Generation
Nvr-tts-it-it
Gratis
Licenza: Riva license
Numero di parametri: B
Quantizzazione: fp32
Supporto: Text To Speech
Nvr-tts-es-es
Gratis
Licenza: Riva license
Numero di parametri: B
Quantizzazione: fp32
Supporto: Text To Speech
Nvr-tts-en-us
Gratis
Licenza: Riva license
Numero di parametri: B
Quantizzazione: fp32
Supporto: Text To Speech
Nvr-tts-de-de
Gratis
Licenza: Riva license
Numero di parametri: B
Quantizzazione: fp32
Supporto: Text To Speech