DeepSeek-R1-Distill-Llama-70B

Reasoning LLM

El modelo DeepSeek-R1-Distill-Llama-70B es un modelo entrenado a través de aprendizaje por refuerzo a gran escala. Fue lanzado por DeepSeek el 20 de enero de 2025, y es una versión destilada del modelo Llama 3.3 70B. La fecha de corte de conocimiento para este modelo es el 1 de julio de 2024.

Acerca del modelo DeepSeek-R1-Distill-Llama-70B

Publicado el huggingface

20/01/2025


Precio de entrada

0.67 /Mtoken(entrada)

Precio de salida

0.67 /Mtoken(salida)


Características soportadas
Llamada a funciónReasoningStreaming
Formatos de salida
raw_textjson_objectjson_schema
Tamaños de contexto
131k
Parámetros
70B

Prueba el modelo jugando con él.