Qwen2.5-VL-72B-Instruct

Visual LLM

Qwen2.5-VL est un modèle vision-langage puissant, conçu pour une compréhension d'image avancée. Il peut générer des légendes d'images détaillées, analyser des documents, effectuer de l'OCR, détecter des objets et répondre à des questions basées sur des visuels, ce qui le rend utile pour les assistants IA, RAG et Agents.

À propos du modèle Qwen2.5-VL-72B-Instruct

Publié sur huggingface

27/01/2025


Token envoyés

0.91 /Mtoken(entrée)

Token reçus

0.91 /Mtoken(sortie)


Fonctionnalités prises en charge
MultimodalStreaming
Formats de sortie
raw_textjson_objectjson_schema
Taille du contexte
32k
Paramètres
72B

Essayez le modèle.