Whisper-large-v3

Audio Analysis

Whisper is een state-of-the-art model voor automatische spraakherkenning (ASR) en spraakvertaling, voorgesteld in het artikel "Robust Speech Recognition via Large-Scale Weak Supervision" door Alec Radford et al. van OpenAI. Whisper is getraind op meer dan 5 miljoen uur gelabelde data en toont een sterke capaciteit om te generaliseren naar veel datasets en domeinen in een zero-shot omgeving.

Over Whisper-large-v3 model

Gepubliceerd op huggingface

01/11/2023


Audioprijs

0.00004083 /seconde


Uitvoerformaten
jsonverbose_jsontext
Contextgroottes
Onbekend
Parameters
1.54B

Probeer het model uit door ermee te spelen.