Qwen2.5-VL-72B-Instruct

Visual LLM

Qwen2.5-VL is a powerful vision-language model, designed for advanced image understanding. It can generate detailed image captions, analyze documents, OCR, detect objects, and answer questions based on visuals, making it useful for AI assistants, RAG and Agents.

Über das Qwen2.5-VL-72B-Instruct Modell

Veröffentlicht am huggingface

27/01/2025


Eingabepreis

0.91 /Mtoken(Eingabe)

Ausgabepreis

0.91 /Mtoken(Ausgabe)


Unterstützte Funktionen
MultimodalStreaming
Ausgabeformate
raw_textjson_objectjson_schema
Kontextgrößen
32k
Parameter
72B

Testen Sie das Modell, indem Sie damit spielen.