DeepSeek-R1-Distill-Llama-70B

Reasoning LLM

O modelo DeepSeek-R1-Distill-Llama-70B é um modelo treinado através de aprendizagem por reforço em larga escala. Foi lançado pela DeepSeek a 20 de janeiro de 2025 e é uma versão simplificada do modelo Llama 3.3 70B. A data limite de conhecimento para este modelo é 1 de julho de 2024.

Sobre o modelo DeepSeek-R1-Distill-Llama-70B

Publicado em huggingface

20/01/2025


Preço de entrada

0.67 /Mtoken(entrada)

Preço de saída

0.67 /Mtoken(saída)


Funcionalidades suportadas
Chamada de funçãoReasoningStreaming
Formatos de saída
raw_textjson_objectjson_schema
Tamanhos de contexto
131k
Parâmetros
70B

Experimente o modelo brincando com ele.