|
||||||||||||||||||||||||||||||||||||||||||||||||||
|
Компоненты H.323. Рекомендация ITU-T G.729
Здесь приведена исчерпывающая информация о компонентах стандарта H.323.
Рекомендация ITU-T G.729 (Приложение A) Рекомендация ITU-T G.729 - это CS-ACELP вокодер (Conjugate-structure Algebraic-code-excited Linear-Prediction). Алгоритм основан на модели кодирования с использованием линейного предсказания с возбуждением по алгебраической кодовой книге (CELP-модель). Кодер оперирует с кадрами речевого сигнала длиной 10мс, дискретизованными с частотой 8КГц, что соответствует 80 16-битным отсчетам в линейном законе. Для каждого кадра производится анализ речевого сигнала и выделяются параметры модели (коэффициенты фильтра линейного предсказания, индексы и коэффициенты усиления в адаптивной и фиксированной кодовых книгах). Далее эти параметры кодируются и передаются в канал. В декодере битовая посылка используется для восстановления параметров сигнала возбуждения и коэффициентов синтезирующего фильтра. Речь восстанавливается путем пропускания сигнала возбуждения через кратковременный синтезирующий фильтр. Синтезирующий фильтр имеет полюсную передаточную функцию 10-го порядка. Для работы синтезатора основного тона используется адаптивная кодовая книга. В последующем, речь улучшается адаптивной постфильтрацией. В случае потери передаваемой кодером битовой посылки, исходные данные для речевого синтезатора получаются интерполяцией данных с предыдущих "хороших" кадров, но при этом энергия интерполированного речевого сигнала постепенно уменьшается, что не создает особого дискомфорта у слушателя. Вокодер обрабатывает кадры речевых сигналов длиной 10мс. Дополнительно, существует задержка длиной 5мс (look-ahead buffer), что в сумме выливается в алгоритмическую задержку 15мс. Также, задержки речевого сигнала в практическом приложении этого алгоритма определяются временем, затрачиваемым на:
Помимо "чистой" рекомендации G.729, существуют "приложения" (annexes). Приложение А - версия рекомендации, менее требовательная к вычислительной мощности ЦПОС за счет некоторого ухудшения качества кодирования. Алгоритм теоретически должен потреблять на 40-50% меньше временного ресурса, чем "чистая" G.729. Изменения, в основном, касаются следующих частей алгоритма: поиск периода основного тона и поиск параметров возбуждения по алгебраической кодовой книге. Полное описание рекомендации можно найти в документах (или на сайте ITU):
Многоканальная реализация для ЦПОС семейства TMS320C54x Алгоритм реализован для ЦПОС семейства TMS320C54x фирмы Texas Instruments. Реализация удовлетворяет следующим требованиям:
Ресурсоемкость реализации для TMS320C54x (версия 1.1)
где N - число одновременно реализуемых каналов. Таким образом, на одном процессоре TMS320C549 с 32 килословами внутренней памяти и мощностью 100MIPS можно реализовать независимую обработку семи речевых каналов Звук По следующим звуковым файлам вы сможете оценить качество алгоритма G.729.A:
Документация Можно получить подробную документацию по представленным реализациям алгоритма ITU-T G.729 (Приложение A), описание API реализаций, подробные инструкции по встраиванию алгоритма в систему обработки речевых сигналов: Использовались материалы сайта http://www.dsp.sut.ru. |
КОМПОНЕНТЫ H323
НОВОСТИ СВЯЗИ
РЕКОМЕНДУЕМ
|
||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||