FreedomSpeech предлагает несколько способов распознавания речи в зависимости от ваших задач:
Распознавание речи (Speech-to-Text)
Узнайте, как происходит распознавание речи в реальном времени. Сервис FreedomSpeech ASR преобразует речь в текст с высокой точностью для казахского и русского языков.
Способы распознавания
Поддерживаемые форматы аудио
- WAV — PCM 16-bit, моно, 8000-48000 Hz
- MP3 — любой битрейт
- OGG — Opus, Vorbis
- FLAC — без потерь качества
- WebM — для веб-приложений
💡 Рекомендации
- Для лучшего качества используйте WAV или FLAC формат
- Рекомендуемая частота дискретизации: 16000 Hz
- Для потокового распознавания используйте WebSocket API