|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Компоненты H.323. Федеральный стандарт MELP на 2.4 кбит/с
Здесь приведена исчерпывающая информация о компонентах стандарта H.323.
Федеральный стандарт MELP на 2.4 кбит/с MELP кодер основан на традиционной параметрической модели кодирования с линейным предсказанием, но, кроме того, содержит пять дополнительных особенностей:
Реализация смешанного возбуждения осуществляется с помощью многополосной смешивающей модели. Эта модель может симулировать частотно-зависимую интенсивность звука, используя адаптивную фильтрацию, выполненную в соответствии с установленным набором фильтров. Главной целью смешанного возбуждения является устранение призвуков, которые имеют место в LPC-вокодерах, особенно при широкополосном акустическом шуме. Когда входная речь огласована, MELP-кодер осуществляет синтез, используя периодические и апериодические импульсы. Апериодические импульсы применяются наиболее часто в переходных областях, между озвученными и неозвученными сегментами речевого сигнала. Эта особенность позволяет декодеру воспроизводить одиночные импульсы, образованные в голосовой щели без внесения тональных призвуков. Адаптивный фильтр, помогающий улучшить оценку спектра, основан на использовании полюсов фильтра линейного предсказания. Он расширяет формантную структуру синтетической речи и улучшает соответствие между синтетической и натуральной формой волны. Это также придает синтетической речи более натуральное звучание. "Размывание" импульсов осуществляется с помощью фиксированного фильтра. Этот фильтр распределяет энергию возбуждения в пределах периода основного тона, снижая этим шероховатости в синтезированной речи. Первые десять амплитуд Фурье определяются из пиковых значений преобразования Фурье сигнала-остатка. Информация, содержащаяся в этих коэффициентах, улучшает точность производимой речевой модели на наиболее важных низких частотах. Они увеличивают качество синтетической речи, особенно мужской на фоне шумов. Используется 512-точечное быстрое преобразование Фурье (FFT) окна длиной 200 отсчетов, центрированного относительно конца кадра. Анализ линейного предсказания 10-го порядка выполняется на входном речевом сигнале с использованием окна Хемминга на 200 отсчетов (25 мс), центрированного относительно последнего отсчета текущего кадра. Процедура автокорреляционного анализа производится с использованием метода Левинсона-Дарбина. Коэффициенты линейного предсказания ai, i=1,2,…,10 преобразовываются в спектральные частоты (LSF). Затем LSF располагаются в порядке возрастания с минимальным промежутком в 50 Гц. Результирующий LSF вектор f затем квантуется векторным квантователем (MSVQ). В синтезаторе MELP-параметры интерполируются синхронно периоду основного тона. К интерполируемым параметрам относятся следующие: усиление (в дБ), линейные спектральные частоты, период основного тона, джиттер, амплитуда Фурье, импульсы и коэффициенты шума для смешанного возбуждения, коэффициент спектрального наклона для адаптивного фильтра спектрального расширения. Список параметров, передаваемых от кодера к декодеру, представлен в таблице:
Более подробное описание алгоритма речевого кодирования MELP на скорости 2400 бит/с можно найти в: Многоканальная реализация для ЦПОС семейства TMS320C54x Алгоритм реализован для ЦПОС семейства TMS320C54x фирмы Texas Instruments. Реализация удовлетворяет следующим требованиям:
Ресурсоемкость реализации для TMS320C54x (версия 1.1)
где N - число одновременно реализуемых каналов. Таким образом, на одном процессоре TMS320C549 с 32 килословами внутренней памяти и мощностью 100MIPS можно реализовать независимую обработку трех речевых каналов Звук По следующим звуковым файлам вы сможете оценить качество алгоритма MELP:
Документация Можно получить подробную документацию по представленным реализациям алгоритма MELP, описание API реализации, подробные инструкции по встраиванию алгоритма в систему обработки речевых сигналов: Использовались материалы сайта http://www.dsp.sut.ru. |
КОМПОНЕНТЫ H323
НОВОСТИ СВЯЗИ
РЕКОМЕНДУЕМ
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||