Qwen2.5-VL-72B-Instruct

Visual LLM

Qwen2.5-VL is a powerful vision-language model, designed for advanced image understanding. It can generate detailed image captions, analyze documents, OCR, detect objects, and answer questions based on visuals, making it useful for AI assistants, RAG and Agents.

Over Qwen2.5-VL-72B-Instruct model

Gepubliceerd op huggingface

27/01/2025


Ingangsprijs

0.91 /Mtoken(invoer)

Uitgangsprijs

0.91 /Mtoken(uitvoer)


Ondersteunde functies
MultimodalStreaming
Uitvoerformaten
raw_textjson_objectjson_schema
Contextgroottes
32k
Parameters
72B

Probeer het model uit door ermee te spelen.