|
Разработчики для скорости 1200 бит/с выбрали вокодер с линейным предсказанием.
Структурно вокодер состоит из двух частей. Первая часть - анализатор, функции которого заключаются в выделении текущих параметров речевого сигнала и их упаковке в кадр соответствующего формата.
Вторая часть - синтезатор по принятому кадру восстанавливает с некоторой ошибкой параметры текущего фрагмента сигнала и с их помощью воспроизводит синтетическую речь.
Цифровой сигнал поступает на предыскажающий фильтр (1-0.9375*z-1) и далее из него посредством полусинхронной с основным тоном процедуры выделяется фрагмент анализа. Предыскажение, кроме компенсации высокочастотной части спектра речевого сигнала, служит для снижения необходимой точности вычислений.
Полусинхронная с основным тоном процедура выделения фрагмента анализа заключается во взвешивании фрагмента треугольным окном переменной длины, зависящей от текущего основного тона. Треугольное окно в данном варианте алгоритма располагается в центре фрагмента. После получения фрагмента анализа коэффициенты линейного предсказания вычисляются путем использования ковариационного метода. Выбор ковариационного метода (среди двух возможных: автокорреляционного и ковариационного) обусловлен тем, что длина фрагмента анализа определяется основным тоном, а при возможных малых значениях длины фрагмента автокорреляционный метод даст значительные искажения текущего спектра сигнала.
Оценка периода основного тона производится по алгоритму, основанному на базе метода Голда-Рабинера.
В канал связи передаются квантованные логарифмы отношения площадей (LAR). При этом квантование производится по неравномерным квантователям. Значение LAR1 на вокализованных и шумовых фрагментах квантуются различными квантователями.
В синтезаторе производится задержка на 1 кадр, поэтому сглаживание канальных ошибок производится на основе принятых параметров из трех текущих кадров - прошлого, настоящего и будущего. Степень сглаживания параметров зависит от числа детектированных канальных ошибок. При увеличении числа ошибок в канале степень сглаженности возрастает.
Сглаженные параметры после интерполяции поступают на синтезирующий фильтр. В настоящем алгоритме приняты следующие правила для интерполяции:
LAR на вокализованных фрагментах интерполируются на каждом периоде основного тона;
Основной тон линейно интерполируется на каждом периоде сигнала;
LAR не интерполируются на невокализованных фрагментах.
В качестве возбуждения на невокализованных фрагментах используется белый шум, а на вокализованных - импульсный отклик фазового звена.
Синтезирующий фильтр реализуется в прямом виде. Его коэффициенты представлены с 16-разрядной точностью. Выходной сигнал пропускается через фильтр, обратный предыскажающему, и после цифро-аналогового преобразования синтетический сигнал поступает на выход.
Более подробное описание алгоритма речевого кодирования LPC1200 на скорости 1200 бит/с можно найти в:
Linear-Rrediction Vocoder for Speech Transmission with 2.4(1.2) kbit/sec rate, St.Petersburg State University of Telecommunication DSP Center, St.Petersburg, 1994
Implementation of HF Modem for Digital Data Transmission, St.Petersburg Bonch-Bruevich State University of Telecommunication DSP Center, St.Petersburg, 1996
Алгоритм реализован для ЦПОС семейства TMS320C3x фирмы Texas Instruments.
Реализация удовлетворяет следующим требованиям:
- функционирует в режиме реального времени;
- совместима со всеми ЦПОС в рамках семейства TMS320C3x
Ресурсоемкость реализации для TMS320C3x
Загрузка процессора |
| | Кодер | Декодер |
Вычислительный ресурс (пиковая загрузка на один канал), млн.оп./с. | 8.14 | 1.83 |
9.97 |
Память |
программа, К слов | 5.52 |
таблицы, К слов | 0.76 |
данные, К слов | 5.16 |
Всего, К слов | 11.44 |
По следующим звуковым файлам вы сможете оценить качество алгоритма LPC1200:
Исходная речь | 
|
Речь, упакованная кодером LPC1200 и восстановленная декодером LPC1200 при нулевых потерях | 
|
Можно получить подробную документацию по представленным реализациям алгоритма LPC1200, описание API реализации, подробные инструкции по встраиванию алгоритма в систему обработки речевых сигналов:
LPC1200 для TMS320C3x (формат Word)
Использовались материалы сайта http://www.dsp.sut.ru.
|