Форматы цифрового видео
В этом разделе мы проанализируем характерные форматы представления цифрового видео, такие как QuickTime фирмы
Apple, MPEG комитета Motion Picture Expert Group и AVI фирмы Microsoft.Общая черта всех популярных форматов цифровых видеофайлов состоит в том, что основная часть любого из них - это система сжатия и восстановления видеоданных (compression/decompression - сокращенно codec), называемая кодеком. Обычно программы, поддерживающие основные форматы видеофайлов, позволяют замещать старые кодеки на новые, более совершенные, по мере разработки последних. Такой подход позволил легко адаптировать форматы видеофайлов и поддерживающие их программы к новым технологиям, как только те становились доступными.
Исходные релизы форматов QuickTime и VfW содержали очень простые кодеки, так как уровень развития компьютерной техники того периода не мог обеспечить применение более качественных методов, требовавших значительно более высоко уровня вычислительного ресурса. По мере совершенствования компьютерных технологий стало возможным использовать более эффективные методы сжатия и распаковки, что привело к применению новых кодеков.
К наиболее известным и широко применяемым форматам следует отнести
QuickTime фирмы Apple. Под этим именем объединены два различных понятия. Для пользователей - это стандартный способ работы с потоковыми данными, такими как видео и аудио. Для производителей - это гибкое средство разработки приложений, совершенствующееся по мере развития технологий. Формат пригоден для работы с любой времязависимой информацией. Видеофильмы в этом формате могут содержать несколько видео- и аудиодорожек. Таким образом, фильм в этом формате может иметь многоязыковую поддержку, а также содержать MIDI-информацию для управления внешним синтезатором. Продолжительность событий на каждой из дорожек также может быть различной. Можно также накладывать друг на друга несколько видеодорожек.Формат был создан первоначально для платформы Macintosh для хранения аудио- и видеоданных на магнитных и оптических носителях.
Сейчас он используется и в оболочке Windows. Предусмотрен специальный набор средств, называемый Movie Toolbox, который обеспечивает редактирование и модификацию видеофильмов в данном формате, т. е. можно вклеивать, вырезать, копировать и редактировать отдельные видеофрагменты таким же образом, как это делается при профессиональном монтаже обычного кино. Данные в этом формате можно хранить на магнитном или компакт-диске в виде обычного файла, а также помещать на цифровой видеомагнитофон.
Набор средств Movie Toolbox определяет шесть методов сжатия, используемых при хранении видеофильмов в этом формате. Перечислим эти методы.
Video Compressor - метод сжатия видеопоследовательностей с потерями, основанный на преобразовании пространственного спектра и временном сжатии. Глубина цвета - 24 бита. Метод отличается высокой скоростью распаковки сжатого видеоряда.
Compact Video Compressor - также метод сжатия с потерями, пригодный для 16 и 24-битного представления цвета. Отличается более высоким качеством и большим коэффициентом сжатия по сравнению с предыдущим, но требует значительных затрат времени на выполнение начального сжатия информации.
Animation Compressor - метод сжатия анимационных последовательностей, основанный на применении алгоритма группового кодирования, рассмотренного в § 3.3. Используется как в варианте с потерями, так и без потерь. Работает с любой глубиной цвета.
Graphic Compressor - предназначен для быстрого сжатия и распаковки 8-битовых неподвижных изображений и их последовательностей. Коэффициент сжатия невелик. Применяется при хранении информации на устройствах с низкой скоростью обмена данными, типа компакт- или DVD-дисков.
Raw Compressor - программа предварительной обработки изображений, позволяющая получить нужную глубину цвета перед тем, как сжать его одним из описанных выше методов.
Аудиоданные в этом формате кодируются в виде последовательности квантованных дискретных выборок в формате AIFF, как это было описано в § 3.4 или непосредственно в ресурсе звуковой среды видеофильма.
Основная структурная единица файлов этого формата носит название атом. Различают атомы-контейнеры и атомы-листья. Контейнеры содержат другие атомы, в том числе и атомы-контейнеры. А атомы-листья содержат только данные. Каждый поток данных файла хранится в отдельном атоме дорожки. Дополнительные сведения о данном формате можно почерпнуть из книг и на сайте www.quicktime.apple.com.
Комитет Motion Picture Expert Group, как уже ранее упоминалось, был создан международной ассоциацией по стандартизации специально для создания высококачественных стандартов сжатия цифрового видео. И действительно был разработан ряд стандартов, таких как MPEG-1, MPEG-2, MPEG-4 для воспроизведения видео с различной скоростью и качеством на платформах Windows, Macintosh и UNIX, а также рекомендован определенный набор методов сжатия видео- и аудиоданных.
Формат MPEG-1 определяет файлы для хранения кодируемого видеоматериала (расширение mpv) и формат системного потока для объединения видео- и аудиоданных (расширение mps), а также три формата для кодирования только аудио (mpa, mp2и l3). Формат MPEG-2 предназначен для вещания и мало пригоден для персональных компьютеров. MPEG-4 предназначен для передачи низкокачественного видео для систем видеотелефонии и видеоконференций.
Стандарты MPEG определяют только способ хранения данных, но не указывают, как были получены данные в этом формате. Все форматы MPEG с потерями. Для кодирования данных в этом формате вычислительных ресурсов ПК недостаточно. Корректная обработка MPEG на ПК без дополнительных аппаратных средств также связана с определенными трудностями. Они могут привести к задержкам или ухудшению качества воспроизведения.
Формат MPEG хранит несколько типов кадров.
Независимые или ключевые кадры (l-frames) не требуют никакой дополнительной информации для декодирования. При их сжатии используется методика, аналогичная JPEG-сжатию, но более эффективная. Предсказуемые кадры (P-frames) хранят различие между предыдущим независимым или предсказуемым кадром и текущим кадров (то, что в § 3.5.2 определялось как межфреймовое дельта-сжатие или компенсация движения). Дальнейшее улучшение качества сжатия достигается путем использования двунаправленных предсказаний движения или B-frames. В нем предсказание сохраняется как разности текущего как с предыдущим, так и с последующим кадрами, вследствие чего последовательность кадров может иногда нарушаться.
При кодировании звука MPEG отбрасывает ряд избыточных данных, опираясь на особенности человеческого слуха, о которых уже говорилось в § 3.4. В результате достигается гораздо более высокий уровень сжатия по сравнению с РСМ и u-Law, о которых говорилось в предыдущем параграфе. Оценивая данный формат, следует отметить, что он гарантирует самое высокое качество как видео, так и аудио, но требует наличия большого количества вычислительных ресурсов.
Формат Audio/Video Interleave (AVI) фирмы Microsoft получил свое название из-за того, что в нем аудио- и видеоданные расположены перемежающимися слоями. В заголовке файла хранится множество различной информации, в том числе, о частоте следования и размере кадров. Программа воспроизведения должна извлечь данные видеокадра и связанного с ним звукового сопровождения, затем передать звук на звуковую карту, а видеоданные распаковать и воспроизвести на экране монитора.
Поддержка равномерного потока данных требует внимания ко всем частям системы воспроизведения для того, чтобы сохранить синхронизацию независимо от задержек при распаковке видеоданных.
В структуре AVI-файла содержатся два блока LIST. Первый из них (LIST hdrl) содержит информацию о фильме в целом и каждом из его потоков, включая разрешение экрана и частоту кадров видеоданных, а также формат, частоту оцифровки и разрядность квантованных аудиоданных.Второй блок LIST movi хранит сами видео- и аудиоданные в виде отдельных потоков, сегментированных на блоки выборки. Интересно отметить, что в формате AVI звуковые данные опережают видео на 0,75 с.