Sautrela Существуют различные модели и библиотеки для создания механизма распознавания. При развертывании он запускается либо в отдельном процессе, либо в виде плагина для FLex — кроссплатформенного графического интерфейса для использования таких моделей. Последнее особенно полезно для создания независимого от платформы программного обеспечения для распознавания. Сотрела использует гибридную модель (HMM), альтернативу традиционным HMM, которая представляет собой смесь конечного автомата и вероятностного конечного автомата со скрытыми состояниями. Сотрела использует скрытое состояние и применение структуры HMM к проблеме распознавания речи. Конечный автомат используется только для представления наблюдений с вероятностным распределением для каждого перехода. В этой модели переходы между состояниями не являются стохастическими, а вероятности перехода вычисляются на основе вероятностей наблюдения. Архитектура Sautrela делает ее модульной системой, основанной на двухуровневой структуре, где первый уровень представляет собой структуру NLG, которая включает в себя обработку аудиосигнала, предварительную обработку звука и декодирование звука. На втором уровне используется модифицированная версия FST. Sautrela — это чистое приложение C/C++. Он использует классы контейнеров STL для доступа к своей внутренней структуре данных. C++ AMI предоставляет низкоуровневый интерфейс для прямого доступа к структуре данных. Через этот интерфейс пользователи могут заменять его компоненты, например, обработку звука, предварительную обработку звука и декодирование звука. Sautrela — многопоточное приложение. Sautrela может обрабатывать данные в нескольких несмежных аудиоформатах (например, 16 кГц или 8 кГц). Sautrela поддерживает различные алгоритмы машинного обучения. Sautrela — это платформа с открытым исходным кодом, Open Benchmark, Open Standard и Open Labware. Он зарегистрирован под Стандартной общественной лицензией GNU (GPL) и может быть загружен с его веб-сайта. Функции: Дискретные и непрерывные модели HMM и GMM являются наиболее часто используемыми моделями в акустическом моделировании.Дискретные модели относятся к моделям с конечными переходами состояний, таким как скрытые марковские модели (HMM) и условное случайное поле. Непрерывные модели используются для моделирования реальных задач, таких как звуковая волна (аудио), как непрерывная функция, например модели гауссовой смеси (GMM). Модели HMM и GMM можно использовать для моделирования явлений, например распознавания речи, где Архитектура Sautrela организована вокруг базового модуля, который используется для обработки почти всех услуг, которые может использовать сигнал (например, от сбора сигнала до хранения, обучения модели, распознавания речи). Этот уровень обычно называют движком, и его можно рассматривать как внешний слой, который обрабатывает все задачи. Движок может работать на различных хостах, и эта функция делает его переносимым. Кроме того, он может адаптироваться к изменениям без жесткой зависимости от хоста, на котором он запущен. Движок также предоставляет подключаемую архитектуру, которую можно использовать для расширения его ядра сторонними поставщиками и алгоритмами, а также новыми задачами. Эта архитектура отражена в области действия компонентов Sautrela: Компоненты Сотрела: Сотрела Ядро: Ядро — это двигатель, который запускает систему. Он предоставляет абстракции и интерфейсы, которые могут использоваться драйверами, реализующими требуемые задачи. Ядро состоит из набора абстракций, которые обрабатывают требуемые задачи общим образом, и набора драйверов, отвечающих за обработку конкретных требований каждой задачи. Сотрела Драйверы: Драйверы реализуют каждую задачу и могут быть расположены в виде плагинов к ядру. Их можно добавлять в ядро по мере готовности, в зависимости от требований каждой новой задачи. Драйверы полностью переносимы и могут работать в различных операционных системах и языковых средах. Все драйверы полностью независимы, а это означает, что между драйверами нет жесткой зависимости. Этот дизайн отражает сценарии использования Sautrela. Плагины компонентов Sautrela: Компоненты представляют собой плагины, которые можно подключать к ядру с помощью плагинов, расширяющих драйверы по умолчанию. Архитектура Sautrela предназначена для улучшения процесса построения механизмов распознавания речи, она предоставляет следующие возможности: Портативность: архитектура основана на подключаемых хостах, которые можно создавать в различных архитектурах и средах. Это позволяет портировать движок на новую операционную систему или целевое оборудование. Модульность: движок можно разделить на абстрактное ядро и драйверы. Это сделано для того, чтобы сделать движок полностью независимым от хостов, которые его запускают. Эта функция обеспечивает большую гибкость и мобильность. Масштабируемость: движок предоставляет возможность добавлять к нему новые задачи без необходимости изменения fb6ded4ff2
Related links:
コメント