Qwen2.5-VL-72B-Instruct

Visual LLM

Qwen2.5-VL is a powerful vision-language model, designed for advanced image understanding. It can generate detailed image captions, analyze documents, OCR, detect objects, and answer questions based on visuals, making it useful for AI assistants, RAG and Agents.

Sobre o modelo Qwen2.5-VL-72B-Instruct

Publicado em huggingface

27/01/2025


Preço de entrada

0.91 /Mtoken(entrada)

Preço de saída

0.91 /Mtoken(saída)


Funcionalidades suportadas
MultimodalStreaming
Formatos de saída
raw_textjson_objectjson_schema
Tamanhos de contexto
32k
Parâmetros
72B

Experimente o modelo brincando com ele.