AI endpoints

Accede fácilmente a modelos de IA preentrenados de renombre mundial.
Innova con APIs simples y seguras en la robusta y confidencial infraestructura de OVHcloud. Optimiza tus aplicaciones con capacidades de IA escalables, eliminando la necesidad de una profunda experiencia. Gana eficiencia con potentes puntos finales de IA, diseñados para la simplicidad y la fiabilidad.

Descubre nuestros modelos

Explora nuestro catálogo de modelos de inteligencia artificial para encontrar el que se ajuste a tus necesidades.

29 resultados disponibles

CODE LLM
Novedad

Qwen3-Coder-30B-A3B-Instruct

0.06

/Mtoken(entrada)

0.22

/Mtoken(salida)

Licencia: Apache 2.0

Número de parámetros: 30B

Cuantización: fp8

Tamaño máximo del contexto: 256K

Soporte: Llamada a función, Code Assistant

Más detalles
REASONING LLM
Novedad

Gpt-oss-120b

0.08

/Mtoken(entrada)

0.4

/Mtoken(salida)

Licencia: Apache 2.0

Número de parámetros: 117B

Cuantización: fp4

Tamaño máximo del contexto: 131K

Soporte: Llamada a función, Reasoning

Más detalles
REASONING LLM
Novedad

Gpt-oss-20b

0.04

/Mtoken(entrada)

0.15

/Mtoken(salida)

Licencia: Apache 2.0

Número de parámetros: 21B

Cuantización: fp4

Tamaño máximo del contexto: 131K

Soporte: Llamada a función, Reasoning

Más detalles
AUDIO ANALYSIS
Novedad

Whisper-large-v3

0.00004083

/segundo

Licencia: Apache 2.0

Número de parámetros: 1.54B

Cuantización: fp16

Soporte: Automatic Speech Recognition

Más detalles
AUDIO ANALYSIS
Novedad

Whisper-large-v3-turbo

0.00001278

/segundo

Licencia: Apache 2.0

Número de parámetros: 0.81B

Cuantización: fp16

Soporte: Automatic Speech Recognition

Más detalles
REASONING LLM
Novedad

Qwen3-32B

0.08

/Mtoken(entrada)

0.23

/Mtoken(salida)

Licencia: Apache 2.0

Número de parámetros: 32.8B

Cuantización: fp8

Tamaño máximo del contexto: 32K

Soporte: Llamada a función, Reasoning

Más detalles
VISUAL LLM
Novedad

Mistral-Small-3.2-24B-Instruct-2506

0.09

/Mtoken(entrada)

0.28

/Mtoken(salida)

Licencia: Apache 2.0

Número de parámetros: 24B

Cuantización: fp8

Tamaño máximo del contexto: 128K

Soporte: Llamada a función, Multimodal

Más detalles
LARGE LANGUAGE MODELS (LLM)
Novedad

Llama-3.1-8B-Instruct

0.1

/Mtoken(entrada)

0.1

/Mtoken(salida)

Licencia: Llama 3.1 Community

Número de parámetros: 8B

Cuantización: fp16

Tamaño máximo del contexto: 131K

Soporte: Llamada a función

Más detalles
COMPUTER VISION
Beta

Yolov11x-image-segmentation

Gratuito

Licencia: AGPL-3.0

Número de parámetros: 0.06B

Cuantización: fp16

Más detalles
COMPUTER VISION
Beta

Yolov11x-object-detection

Gratuito

Licencia: AGPL-3.0

Número de parámetros: 0.06B

Cuantización: fp16

Más detalles
LARGE LANGUAGE MODELS (LLM)

Mixtral-8x7B-Instruct-v0.1

0.63

/Mtoken(entrada)

0.63

/Mtoken(salida)

Licencia: Apache 2.0

Número de parámetros: 46.7B

Cuantización: fp16

Tamaño máximo del contexto: 32K

Más detalles
LARGE LANGUAGE MODELS (LLM)
Novedad

Meta-Llama-3_3-70B-Instruct

0.67

/Mtoken(entrada)

0.67

/Mtoken(salida)

Licencia: Llama 3.3 Community

Número de parámetros: 70B

Cuantización: fp8

Tamaño máximo del contexto: 131K

Soporte: Llamada a función

Más detalles
LARGE LANGUAGE MODELS (LLM)
Novedad

Mistral-7B-Instruct-v0.3

0.1

/Mtoken(entrada)

0.1

/Mtoken(salida)

Licencia: Apache 2.0

Número de parámetros: 7B

Cuantización: fp16

Tamaño máximo del contexto: 127K

Soporte: Llamada a función

Más detalles
EMBEDDINGS

Bge-base-en-v1.5

0.01

/Mtoken(entrada)

Licencia: MIT

Número de parámetros: 0.109B

Cuantización: fp16

Más detalles
VISUAL LLM
Novedad

Qwen2.5-VL-72B-Instruct

0.91

/Mtoken(entrada)

0.91

/Mtoken(salida)

Licencia: Qwen

Número de parámetros: 72B

Cuantización: fp8

Tamaño máximo del contexto: 32K

Soporte: Multimodal

Más detalles
EMBEDDINGS

Bge-multilingual-gemma2

0.01

/Mtoken(entrada)

Licencia: Gemma

Número de parámetros: 0.567B

Cuantización: fp16

Más detalles
REASONING LLM
Novedad

DeepSeek-R1-Distill-Llama-70B

0.67

/Mtoken(entrada)

0.67

/Mtoken(salida)

Licencia: MIT & Meta Llama 3 Community License

Número de parámetros: 70B

Cuantización: fp8

Tamaño máximo del contexto: 131K

Soporte: Llamada a función, Reasoning

Más detalles
LARGE LANGUAGE MODELS (LLM)

Mistral-Nemo-Instruct-2407

0.13

/Mtoken(entrada)

0.13

/Mtoken(salida)

Licencia: Apache 2.0

Número de parámetros: 12.2B

Cuantización: fp16

Tamaño máximo del contexto: 118K

Soporte: Llamada a función

Más detalles
EMBEDDINGS

BGE-M3

0.01

/Mtoken(entrada)

Licencia: MIT

Número de parámetros: 0.567B

Cuantización: fp16

Más detalles
IMAGE GENERATION

Stable-diffusion-xl-base-v10

Gratuito

Licencia: OpenRail++

Número de parámetros: 3.5B

Cuantización: fp32

Soporte: Image Generation

Más detalles
AUDIO ANALYSIS

Nvr-tts-en-us

Gratuito

Licencia: Riva license

Número de parámetros: B

Cuantización: fp32

Soporte: Text To Speech

Más detalles
TRANSLATION

T5-large

Gratuito

Licencia: Apache 2.0

Número de parámetros: 0.738B

Cuantización: fp32

Más detalles
AUDIO ANALYSIS

Nvr-tts-it-it

Gratuito

Licencia: Riva license

Número de parámetros: B

Cuantización: fp32

Soporte: Text To Speech

Más detalles
NATURAL LANGUAGE PROCESSING

Roberta-base-go_emotions

Gratuito

Licencia: MIT

Número de parámetros: 0.125B

Cuantización: fp32

Soporte: Emotion Extraction

Más detalles
AUDIO ANALYSIS

Nvr-tts-de-de

Gratuito

Licencia: Riva license

Número de parámetros: B

Cuantización: fp32

Soporte: Text To Speech

Más detalles
AUDIO ANALYSIS

Nvr-tts-es-es

Gratuito

Licencia: Riva license

Número de parámetros: B

Cuantización: fp32

Soporte: Text To Speech

Más detalles
NATURAL LANGUAGE PROCESSING

Bert-base-multilingual-uncased-sentiment

Gratuito

Licencia: MIT

Número de parámetros: 0.167B

Cuantización: fp32

Soporte: Sentiment Analysis

Más detalles
NATURAL LANGUAGE PROCESSING

Bert-base-NER

Gratuito

Licencia: MIT

Número de parámetros: 0.108B

Cuantización: fp32

Soporte: Name Entity Recognition

Más detalles
NATURAL LANGUAGE PROCESSING

Bart-large-cnn

Gratuito

Licencia: MIT

Número de parámetros: 0.406B

Cuantización: fp32

Más detalles