TG Telegram Group & Channel
DevOps | United States America (US)
Create: Update:

🔊 SenseVoice — это универсальная модель для обработки речи, способная распознавать речь, определять язык, анализировать эмоции

Она поддерживаете более 50 языков, а её точность превосходит Whisper.

Модель отличается высокой скоростью обработки: например, SenseVoice-Small тратит всего 70 мс на 10 секунд аудио, что в 15 раз быстрее Whisper-Large. Она также умеет определять эмоции в речи и распознавать звуки вроде музыки, смеха или кашля.

Разработчики предлагают удобные инструменты для дообучения под свои задачи и готовые решения для развёртывания. Недавно добавили поддержку временных меток, экспорт в ONNX и улучшили мультиязычное распознавание.

🤖 GitHub

@devopsitsec

🔊 SenseVoice — это универсальная модель для обработки речи, способная распознавать речь, определять язык, анализировать эмоции

Она поддерживаете более 50 языков, а её точность превосходит Whisper.

Модель отличается высокой скоростью обработки: например, SenseVoice-Small тратит всего 70 мс на 10 секунд аудио, что в 15 раз быстрее Whisper-Large. Она также умеет определять эмоции в речи и распознавать звуки вроде музыки, смеха или кашля.

Разработчики предлагают удобные инструменты для дообучения под свои задачи и готовые решения для развёртывания. Недавно добавили поддержку временных меток, экспорт в ONNX и улучшили мультиязычное распознавание.

🤖 GitHub

@devopsitsec


>>Click here to continue<<

DevOps






Share with your best friend
VIEW MORE

United States America Popular Telegram Group (US)