Qwen2.5-VL-72B-Instruct

Visual LLM

Qwen2.5-VL is a powerful vision-language model, designed for advanced image understanding. It can generate detailed image captions, analyze documents, OCR, detect objects, and answer questions based on visuals, making it useful for AI assistants, RAG and Agents.

O modelu Qwen2.5-VL-72B-Instruct

Opublikowano huggingface

27/01/2025


Cena wejściowa

0.91 /Mtoken(wejście)

Cena wyjściowa

0.91 /Mtoken(wyjście)


Obsługiwane funkcje
MultimodalStreaming
Formaty wyjściowe
raw_textjson_objectjson_schema
Rozmiary kontekstu
32k
Parametry
72B

Wypróbuj model, bawiąc się nim.