DeepSeek-R1-Distill-Llama-70B

Reasoning LLM

Le modèle DeepSeek-R1-Distill-Llama-70B est un modèle entraîné par apprentissage par renforcement à grande échelle. Il a été publié par DeepSeek le 20 janvier 2025 et il s'agit d'une version distillée du modèle Llama 3.3 70B. La date limite de connaissance pour ce modèle est le 1er juillet 2024.

À propos du modèle DeepSeek-R1-Distill-Llama-70B

Publié sur huggingface

20/01/2025


Token envoyés

0.67 /Mtoken(entrée)

Token reçus

0.67 /Mtoken(sortie)


Fonctionnalités prises en charge
Function callingReasoningStreaming
Formats de sortie
raw_textjson_objectjson_schema
Taille du contexte
131k
Paramètres
70B

Essayez le modèle.