Электронные издания

       

Принципы представления цифрового видео


Обычные телевизионные видеоданные представляют собой поток аналоговых сигналов. Компьютерная обработка видеоинформации состоит в преобразовании их в цифровой формат с последующим хранением этих данных на жестком или компакт-диске или другом устройстве хранения информации. Оцифровка видеосигнала, как и оцифровка звука, включает те же две стадии: дискретизация данных аналогового видеопотока, т. е. снятие отсчетов с определенной частотой, и преобразование каждого такого отсчета в цифровой эквивалент или квантование.

При хранении оцифрованных данных в несжатом формате изображение размером 400x300 пикселов с глубиной цвета 24 бита на пиксел, обновляемое с частотой 25 Гц, потребует скорости передачи информации более 5,5 Мб/с. А хранение данных для показа 5-минутного ролика в указанном формате потребует информационное пространство, превышающее 1,6 Гб. Естественно, что при работе с такими данными невозможно обойтись без сжатия, однако и этом случае потребуется время, определенные вычислительные мощности на распаковку данных. Достичь оптимального сжатия можно путем совершенствования аппаратных или программных средств, а может быть, совместно тех и других.

В качестве аппаратных средств используются специальные видеопроцессоры, которые поддерживают высокоскоростную компрессию и декомпрессию данных, не загружая центральный процессор компьютера. Второй подход состоит в использовании специализированных методов программного сжатия и распаковки предварительно сжатых видеоданных.

Аналоговый видеосигнал включает в себя несколько различных компонентов, объединенных в единое целое. Такой составной видеосигнал малопригоден для оцифровки. Предварительно его следует разделить на так называемые базовые компоненты. Обычно компоненты представляют собой три различных сигнала, соответствующие определенной модели представления цветового пространства. Если в статической графике используется RGB-цветовое представление, то в цифровом видео чаще используется модель YUV. Видеопоследовательности отображаются в виде серии кадров или фреймов, каждый из которых, no-существу, является графическим изображением и включает в себя определенное число пикселов.
Такой видеофрейм может быть сжат с помощью одного из алгоритмов сжатия изображений, с потерями или без потерь.

Так, применение дискретного косинусного преобразования, рассмотренного в § 3.3, позволяет выделить высокочастотные составляющие пространственного спектра, которые практически не воспринимаются человеческим глазом и могут быть отброшены как избыточная информация. Затем фрейм может быть сжат с помощью одного из алгоритмов сжатия без потерь или за счет более сложной схемы, такой как JPEG. При внутрифреймовом кодировании достигается коэффициент сжатия в пределах от 20 до 40. Еще большее значение этого коэффициента достигается при кодировании совокупности фреймов.

Различие между кадрами в обычной видеопоследовательности, как правило, невелико. Поэтому если кодировать не целиком каждый фрейм, а лишь отличия каждого последующего фрейма от предыдущего, то объем данных, характеризующий каждый фрейм, существенно уменьшится. Это так называемое межфреймовое дельта-сжатие или компенсация движения. Применение типовых схем компенсации движения позволяет довести суммарный коэффициент сжатия видеопоследовательности до 200 и более.

3.5.3.


Содержание раздела