Qwen2.5-VL-72B-Instruct

Visual LLM

Qwen2.5-VL is een krachtig visie-taalmodel, ontworpen voor geavanceerd beeldbegrip. Het kan gedetailleerde afbeeldingsbijschriften genereren, documenten analyseren, OCR, objecten detecteren en vragen beantwoorden op basis van visuals, waardoor het nuttig is voor AI-assistenten, RAG en Agents.

Over Qwen2.5-VL-72B-Instruct model

Gepubliceerd op huggingface

27/01/2025


Ingangsprijs

0.91 /Mtoken(invoer)

Uitgangsprijs

0.91 /Mtoken(uitvoer)


Ondersteunde functies
MultimodalStreaming
Uitvoerformaten
raw_textjson_objectjson_schema
Contextgroottes
32k
Parameters
72B

Probeer het model uit door ermee te spelen.