|
||||||||||||||||||||||||||||||||||||||||||||||||||
|
Компоненты H.323. Вокодер VSELP на 8кбит/с
Здесь приведена исчерпывающая информация о компонентах стандарта H.323.
Вокодер VSELP на 8кбит/с Алгоритм кодирования речи Vector Sum Excited Linear Prediction (VSELP) принадлежит к классу кодеров речи известных как Code Excited Linear Prediction (CELP). Кодеры такого рода используют кодовые книги, содержащие наборы векторов для апроксимации вектора возбуждения. Поиск апроксимирующего вектора требует значительного количества вычислений даже для кодовых книг минимально приемлемого размера. Алгоритм VSELP использует кодовые книги специальной структуры, что позволяет уменьшить вычислительные затраты. Вычисление параметров линейного предсказания осуществляется один раз за полный фрагмент (20мс) автокорреляционным методом. Поскольку коэффициенты отражения и соответствующие им коэффициенты линейного предсказания расчитываются один раз для фрагмента речи, коэффициеты для остальных подфрагментов линейно интерполируются. Алгоритм VSELP использует метод "анализ-через-синтез" для выбора оптимального набора параметров речи по критерию минимальной энергии ошибки (MSE). Средняя энергия рассчитывается один раз за фрагмент и квантуется пятью битовым квантователем. Наибольшее значение кода 31 соответствует средней энергии c уровнем -4dB относительно максимально возможного уровня энергии, равного квадрату максимального значения отсчета речи. Остальные уровни расположены c относительным интервалом -2dB. После поиска части сигнала возбуждения в адаптивной кодовой книге, осуществляется поиск оставшейся части возбуждения в двух фиксированных кодовых книгах. Адаптивная кодовая книга представляет собой память трансверсального (КИХ) фильтра с одним ненулевым коэффициентом и с переменной задержкой. Алгоритм VSELP не содержит непосредственного квантования коэффициентов усиления. Осуществляется квантование только отдельных параметров. Кодер VSELP каждые 20 мс формирует 160 бит данных (приложение 1), что соответствует скорости передачи 8000 б/с (из них один бит отводится на синхронизацию). Декодер имеет сходную с кодером структуру. По принятым данным он востанавливает передаваемую речь. Для этого он:
Префильтр основного тона повышает качество синтезированной речи, улучшая периодичность участков огласованной речи. Адаптивный постфильтр улучшает субъективно воспринимаемое качество речи, маскируя шумы и улучшая "ясность" синтезированной речи. Реализация для ЦПОС семейства TMS320C3x Алгоритм реализован для ЦПОС семейства TMS320C3x фирмы Texas Instruments. Реализация удовлетворяет следующим требованиям:
Ресурсоемкость реализации для TMS320C3x
Звук По следующим звуковым файлам вы сможете оценить качество алгоритма VSELP:
Документация Можно получить подробную документацию по представленным реализациям алгоритма VSELP, описание API реализации, подробные инструкции по встраиванию алгоритма в систему обработки речевых сигналов: Использовались материалы сайта http://www.dsp.sut.ru. |
КОМПОНЕНТЫ H323
НОВОСТИ СВЯЗИ
РЕКОМЕНДУЕМ
|
||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||