Whisper-large-v3

Audio Analysis

Whisper è un modello avanzato per il riconoscimento vocale automatico (ASR) e la traduzione, proposto nel documento "Robust Speech Recognition via Large-Scale Weak Supervision" di Alec Radford et al. di OpenAI. Addestrato per oltre 5 milioni di ore con dati etichettati, Whisper dimostra una forte capacità di generalizzare su molti dataset e domini in un contesto zero-shot.

Informazioni sul modello Whisper-large-v3

Pubblicato il huggingface

01/11/2023


Prezzo audio

0.00004083 /secondo


Formati di output
jsonverbose_jsontext
Dimensioni del contesto
Sconosciuto
Parametri
1.54B

Prova il modello giocando con esso.