Qwen2.5-VL-72B-Instruct

Visual LLM

Qwen2.5-VL is a powerful vision-language model, designed for advanced image understanding. It can generate detailed image captions, analyze documents, OCR, detect objects, and answer questions based on visuals, making it useful for AI assistants, RAG and Agents.

À propos du modèle Qwen2.5-VL-72B-Instruct

Publié sur huggingface

27/01/2025


Token envoyés

0.91 /Mtoken(entrée)

Token reçus

0.91 /Mtoken(sortie)


Fonctionnalités prises en charge
MultimodalStreaming
Formats de sortie
raw_textjson_objectjson_schema
Taille du contexte
32k
Paramètres
72B

Essayez le modèle.