|
||||||||||||||||||||||||||||||||||||||||||||||||||
|
Компоненты H.323. Федеральный стандарт FS1016
Здесь приведена исчерпывающая информация о компонентах стандарта H.323.
Федеральный стандарт FS1016 на 4.8 кбит/с Алгоритм CELP (Code Excited Linear Prediction), основанный на рекомендации FS1016, построен на модели кодирования с использованием процедуры анализа-через-синтез, линейного предсказания и векторного квантования. Для моделирования кратковременного спектра речевого сигнала (формантной структуры) используется фильтр линейного предсказания 10-го порядка. Для формирования сигнала возбуждения используются адаптивная и стохастическая кодовые книги. Вычислительная сложность алгоритма определяется процедурами поиска оптимальных векторов возбуждения по двум кодовым книгам. Таким образом, CELP анализ состоит из трёх основных процедур:
CELP синтез состоит из этих же процедур, выполненных в обратном порядке. Кодер оперирует с кадрами речевого сигнала длиной 30мс (240 отсчётов), дискретизованными с частотой 8КГц. В свою очередь каждый из этих кадров делится на четыре подкадра по 60 отсчётов. Для каждого кадра производится анализ речевого сигнала, и выделяются передаваемые параметры CELP-модели: 10 линейных спектральных пар (несут информацию о коэффициентах фильтра линейного предсказания), индексы и коэффициенты усиления в адаптивной и фиксированной кодовых книгах. Далее это параметры кодируются в битовый поток и передаются в канал. В декодере эта битовая посылка используется для восстановления параметров сигнала возбуждения и коэффициентов синтезирующего фильтра. Далее восстанавливается речь, путем пропускания сигнала возбуждения через синтезирующий фильтр. Затем для улучшения качества восприятия синтетического сигнала выходной сигнал с фильтра-синтезатора пропускается через постфильтр. Как уже упоминалось, входной поток речевых отсчётов делится кодером на кадры по 30 мс (240 отсчётов). Кодер производит LPC анализ на фрагменте анализа длиной 240 отсчётов, который перекрывает вторую половину текущего кадра и первую половину следующего кадра. Таким образом, в кодере образуется алгоритмическая задержка в 15 мс. Дополнительные задержки в практическом приложении этого алгоритма возникают по следующим причинам:
Полное описание алгоритма можно найти в:
Реализация для семейства TMS320C3x Алгоритм реализован для ЦПОС семейства TMS320C3x фирмы Texas Instruments. Реализация удовлетворяет следующим требованиям:
Ресурсоемкость реализации
Звук По следующим звуковым файлам вы сможете оценить качество алгоритма FS1016:
Документация Можно получить подробную документацию по представленным реализациям алгоритма FS1016, описание API реализации, подробные инструкции по встраиванию алгоритма в систему обработки речевых сигналов: Использовались материалы сайта http://www.dsp.sut.ru. |
КОМПОНЕНТЫ H323
НОВОСТИ СВЯЗИ
РЕКОМЕНДУЕМ
|
||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||