Qwen2.5-VL-72B-Instruct

Visual LLM

O Qwen2.5-VL é um potente modelo de linguagem de visão, concebido para a compreensão avançada de imagens. Consegue gerar legendas detalhadas de imagens, analisar documentos, realizar OCR, detetar objetos e responder a perguntas com base em elementos visuais, tornando-o útil para assistentes de IA, RAG e Agentes.

Sobre o modelo Qwen2.5-VL-72B-Instruct

Publicado em huggingface

27/01/2025


Preço de entrada

0.91 /Mtoken(entrada)

Preço de saída

0.91 /Mtoken(saída)


Funcionalidades suportadas
MultimodalStreaming
Formatos de saída
raw_textjson_objectjson_schema
Tamanhos de contexto
32k
Parâmetros
72B

Experimente o modelo brincando com ele.