Предыдущая Следующая

Dolby Digital АС3 позволяет декодировать:

•          до пяти широкополосных каналов с шириной 20 кГц каждый;

•          один узкополосный канал с полосой до 120 Гц и ослаблением сигнала до 3 дБ;

•          управляющие сигналы и данные, позволяющие идентифицировать используемую структуру каналов.

Сжатие на порядок более мощного входного потока (коэффициент компрессии а АС-3 выбирается в пределах от 9:1 до 16:1) базируется на алгоритме Modified Discrete Cosine Transform. MDCT использует эффект психоакустического маскирования. Применяя модель слухового маскирования, кодер представляет оптимальное количество разрядов для аудиосигнала в каждой полосе. Дополнительно происходит перераспределение разрядов между разными каналами в соответствии с моделью, по которой более насыщенной частотами канал потребует больше данных для передач, чем другие, слабо заполненные, а также учитывается, что сильный сигнал в одном канале может маскировать появляющийся шум в других каналах. В результате Dolby Digital может использовать пропорционально больше передаваемых данных для кодирования звука, выдавая более качественный сигнал и позволяя кодировать несколько звуковых каналов в более низкоскоростные потоки данных, чем требует даже один канал на компакт-диске.

Если говорить на более простом языке, технологии сжатия звука заключается в том, что слушатель в присутствии более громких частотных составляющих меньше внимания обращает на тихие гармоники, которые «можно удалить без существующего ущерба для качества звука». В какой степени создателям алгоритмов компрессии удается избегать «существенного ущерба» - судить слушателям. Типичные схемы «оптимизации» аудио данных основаны на спектральном анализе входного сигнала, как правило, реализуемое в соответствие с формулами быстрого преобразования Фуры (более сложные модели типа преобразования Карунена-Лоэва не находят широкого применения, так как их реализация требует значительных вычислительных затрат). В результате сложнейших процедур анализа спектра процессор выявляет те составляющие информационного потока, которым можно пожертвовать. Содержание данных процедур является ноу-хау разработчика и продается производителю совместимого оборудования только по лицензии и, в большинстве случаев, в виде готовой программы, «зашитой» память процессора. Какова же природа этих «черных ящиков»? Какие подходы к компрессии звукового сигнала существуют?


Предыдущая Следующая
Сайт создан в системе uCoz