Публикации по теме speech-recognition

Публикации по теме 'speech-recognition'

Бедняки ASR pt. 1

Что и почему Во многих проектах, в которых я участвую, ASR — это крутая новинка. Как я уже писал ранее , ASR может повысить прозрачность процессов и может эффективно сочетаться с последующими приложениями для аналитики, поиска и моделирования. Большинство вариантов использования, которые я видел, также имеют значительные финансовые последствия. Рассмотрим небольшую гипотетическую группу поддержки (10 человек), обрабатывающую скромные, равномерно распределенные 500 звонков в день..

Распознавание речи

Распознавание речи – это процесс понимания слов, которые произносят люди. Речевые сигналы улавливаются с помощью микрофона, и система пытается понять захваченные слова. Распознавание речи широко используется при взаимодействии человека с компьютером, смартфонах, транскрипции речи, биометрических системах, безопасности и многом другом. Исследователи работают над различными аспектами и приложениями речи, такими как понимание произносимых слов, определение того, кто говорит, распознавание..

Преобразование речи в текст с использованием сверточных нейронных сетей

Новички в области глубокого обучения быстро узнают, что рекуррентные нейронные сети (RNN) предназначены для построения моделей для последовательных задач с данными (например, языкового перевода), тогда как сверточные нейронные сети (CNN) предназначены для задач, связанных с изображениями и видео. Это довольно хорошее правило большого пальца, но недавняя работа в Facebook показала отличные результаты для последовательных данных, просто используя CNN. В этой статье я описываю свою работу..

Поймите, как генерируется мел-спектрограмма.

Когда мы работаем с mel-spectrogram для создания функции для сети глубокого обучения, размер функции имеет важное значение. Эта статья позволяет людям понять, как рассчитывается размер функции, после чего мы можем реализовать извлечение функций самостоятельно. мы сделаем несколько шагов, сначала загрузим данные из wav-файла, затем напрямую воспользуемся API mel_spectrogram из librosa, после этого мы будем шаг за шагом вычислять mel_spectrogram вручную. Наконец, мы сравним руководство со..

Вопросы по теме 'speech-recognition'

Скрипт распознавания речи не работает

У меня есть этот скрипт распознавания речи, который записывает аудиовход и отправляет на серверы распознавания речи Google, получает результаты и показывает их на терминале Ubuntu. Но у меня не получается. Я предполагаю, что Google внес изменения...

1070 просмотров

speech-recognition ubuntu-12.04

21.05.2024

Распознавание речи - работайте непрерывно

Я пытаюсь создать голосовой редактор на базе HTML5 с помощью API распознавания речи. В настоящее время проблема заключается в том, что когда вы начинаете запись, она длится только определенное время (в основном, пока пользователь не перестанет...

10077 просмотров

javascript html speech-recognition html5-audio

22.03.2024