Модель Whisper перевод аудио речи в текст

Создано 17 Март, 2023 • 1,021 просмотров

Модель распознающая устную речь и переводящая в текст для дальнейшего анализа и использования

Whisper — это универсальная модель распознавания речи. Он обучен на большом наборе данных разнообразного аудио, а также является многозадачной моделью, которая может выполнять распознавание речи на множестве языков, а также может переводить речь и проводить автоматическую идентификацию языка. На нашем сайте используется модель Whisper v2-large.

В настоящее время нет никакой разницы между версией Whisper с открытым исходным кодом и версией, доступной через наш сайт. Однако на нашем сайте мы предлагаем оптимизированный процесс вывода, который позволяет запускать Whisper намного быстрее, чем с помощью других средств. Для получения более подробной технической информации о Whisper вы можете прочитать документ по ссылке.