Whisper-large-v3

Audio Analysis

Whisper est un modèle de pointe pour la reconnaissance vocale automatique (ASR) et la traduction vocale, proposé dans l'article "Robust Speech Recognition via Large-Scale Weak Supervision" par Alec Radford et al. d'OpenAI. Entraîné sur plus de 5M d'heures de données étiquetées, Whisper démontre une forte capacité à se généraliser à de nombreux ensembles de données et domaines en configuration zero-shot.

À propos du modèle Whisper-large-v3

Publié sur huggingface

01/11/2023


Prix audio

0.00004083 /seconde


Formats de sortie
jsonverbose_jsontext
Taille du contexte
Inconnu
Paramètres
1.54B

Essayez le modèle.