Электронные издания

       

Форматы представления графической информации


Без

иллюстраций любое издание выглядит однообразно. Хорошо подобранная и рационально размещенная в издании графика не только улучшает дизайн издания, но и делает его значительно более информативным для читателя, помогает лучше передать его содержание и даже суть. Однако графика требует значительного информационного пространства для своего размещения, с чем связаны основные ограничения ее использования.

Известны два способа описания компьютерного изображения: точечный (растровый), при котором изображение формируется из отдельных точек, и векторный (контурный), где изображение состоит из отдельных объектов, ограниченных замкнутыми или незамкнутыми контурами, каждый из которых представляет собой сочетание отдельных отрезков прямых линий (векторов) и кривых (дуги окружностей, фрагменты параболических кривых и кубических сплайнов) линий. Каждый такой графический объект можно перемещать, масштабировать, вращать без потери качества изображения и независимо от любых других объектов.

Векторные файлы содержат математическое описание всех элементов изображения, которое используется программой визуализации для их отображения на экране монитора. Таким образом, сам процесс отображения информации требует определенных вычислительных мощностей для преобразования математического описания объектов в растровый формат монитора. Векторная графика характеризуется рядом положительных черт, к числу которых можно отнести следующие:

  1. Экономичность хранения изображений, т. е. сравнительно небольшие размеры графических файлов, хранящих изображение в векторном формате.

    Легкость трансформации и манипулирования отдельными графическими объектами (и всем изображением в целом).

    Максимальное использование разрешающей способности выводного устройства, с помощью которого осуществляется визуализация цифрового изображения, так как величина разрешения обычно в графическом файле непосредственно не задана.

    Простота интеграции с текстом, который состоит из отдельных символов, формируемых преимущественно контурным методов (например, элементы TrueType-шрифтов и шрифтовые объекты в формате PostScript).


    Простейшие форматы векторного типа реализованы в электронных таблицах, используемых в пакетах Lotus 1-2-3 и Excel. Большинство же векторных форматов разработано для хранения чертежей, созданных программами САПР (Систем Автоматизированного Проектирования). В издательском деле и полиграфии к наиболее распространенным можно отнести формат PostScript, используемый для описания сверстанных страниц в фотонаборных автоматах и лазерных принтерах.

    С точки зрения живописности и реалистичности изображения векторная графика имеет весьма ограниченные возможности, поэтому в издательском деле шире используется растровое представление. В случае применения векторной графики определенные трудности возникают и с автоматизацией ввода графического изображения в компьютер или оцифровкой изображения. Сканеры, цифровые фото- и видеокамеры хранят оцифрованное изображение в растровых форматах.

    Точечная, или растровая, графика исторически стала применяться значительно раньше векторной. К ней можно отнести художественные изображения мозаичного типа: смальту, мозаику и даже вышивку. Таким образом, к ней относят изображения, полученные из мельчайших отдельных элементов, каждый из которых неделим и описывается постоянством тона на всем своем протяжении. Такие элементы принято называть пикселами (это понятие мы уже упоминали в главе 2). Каждый такой пиксел формально независим от соседних, т. е. может иметь различные характеристики: яркость, цветовой тон, насыщенность цвета и прочее.



    К достоинствам точечной графики можно отнести следующие факторы:



    • простота и легкость ввода (оцифровки) изображений;

      удобство технической реализации вывода информации (на монитор, лазерный или струйный принтер и т. д.);

      реалистичность изображения;

      возможность получения тонких живописных эффектов, таких как туман, тонкие цветовые переходы и нюансы цвета, перспектива изображения, размытость и нерезкость и пр.

      Однако и недостатки точечной графики существенны. К основным из них относятся:





      • необходимость точных установок параметров до начала создания графического изображения, в частности, задания количества точек на единицу длины изображения, размера изображения по каждой координате, а также глубины цвета - количества бит для цветового представления каждого отдельного пиксела;

        большой информационный объем получаемого графического файла, который определяется произведением трех величин: площади изображения, разрешающей способности и глубины цвета в согласованных единицах измерения, например, максимальное разрешение в пакете PhotoShop составляет 10000 пиксел/дюйм при максимальном значении 30000 пикселов по каждой координате, чему соответствуют размеры файлов до нескольких сотен Мб;

        при повороте и других трансформациях изображения составляющие его горизонтальные и вертикальные линии превращаются в ступенчатые, т. е. обязательно появляются искажения при трансформациях изображения.

        Важной характеристикой любого изображения, в частности растрового, является глубина цвета. Самое простое изображение использует два уровня серого, т. е. черный и белый. На цветовое описание элемента такого изображения (пиксела) требуется лишь 1 бит. Следующий вариант использует множество уровней серого, обычно 256, в результате чего каждый элемент изображения кодируется 1 байтом. Цветные изображения также могут быть различных типов.

        В некоторых графических файлах используют так называемые индексированные цвета. В этом случае количество цветовых оттенков обычно не превышает 256, причем все они хранятся в самом графическом файле в виде палитры цветовых оттенков и каждый возможный цветовой тон в изображении соответствует одному из элементов этой палитры. Общее разнообразие или глубина цвета равна, как и в предыдущем случае, 8 битам, или 1 байту. Кстати, индексированные цвета используются и в оболочке Windows в виде встроенной палитры цветов, с которой мы еще не раз встретимся в рамках данного учебника.

        Наконец, так называемое полноцветное изображение (True color) чаще всего работаете RGB-цветовом пространстве и использует! байт на каждый из трех основных цветовых компонент (красная, зеленая и синяя), т. е.


        общая глубина цвета равна 24 битам, или 3 байтам. При таком представлении количество различных цветовых оттенков превышает 16 миллионов. В некоторых графических файлах используется даже 48-битная глубина цвета. В этом случае каждый основной цвет представляется 16 битами или 65576 различными уровнями, а общее число различных цветовых оттенков выражается фантастической величиной, превышающей 2,6-1014.

        Для электронных изданий, зачастую распространяемых по сетям, информационный объем представляет собой очень важную характеристику. Понятно поэтому стремление использовать векторные форматы или же специальные растровые форматы с внутренним сжатием информации для представления графических файлов. Кратко остановимся на методах и средствах сжатия изображений.

        Существует две группы методов сжатия изображений: без потерь и с потерями. В первом случае при распаковке сжатого графического файла полностью восстанавливается вся исходная информация, в том числе, цветовой оттенок каждого отдельного пиксела. Во втором же - часть информации теряется, т. е. изображение становится несколько менее качественным, некоторые мелкие его детали утрачиваются. Во многих случаях это вполне допустимо, так как человеческий глаз различает, в лучшем случае, лишь несколько тысяч оттенков цвета и не реагирует на мел кие детали изображения (разрешение глаза близко к одной угловой минуте, откуда при нормальном расстоянии до изображения в 25-30 см можно подсчитать величину линейного разрешения глаза, которая близка к 90-100 мкм).

        Большинство методов сжатия без потерь основано на варианте группового кодирования (Run-Length Encoding - RLE). Идея такого метода заключается в том, что последовательности повторяющихся значений заменяются на пару чисел, первое из которых дает количество повторяющихся

        значений, а второе - само это значение. В описаниях многоцветных изображений очень часто соседние пикселы характеризуются одними и теми же тоновыми и цветовыми характеристиками, что и обеспечивает эффективность такого сжатия



        Энциклопедия форматов графических файлов.- Киев: BHV-Киев, 1997.',''));">
        .

        Схема сжатия без потерь Лемпела-Зива-Велча (LZW) в последние годы используется все шире и шире. Она позволяет работать сданными любого типа, обеспечивая достаточно быстрое сжатие и распаковку данных. Этот алгоритм называют алгоритмом подстановок или алгоритмом сжатия словарного типа. На основе входного потока данных алгоритм формирует словарь данных (его также называют переводной таблицей или таблицей строк). Образцы новых данных сравниваются с записями словаря. Если они там не представлены, то создается новая кодовая фраза. Если строка повторно встречается во входном потоке, то в выходной поток записывается ссылка на соответствующую строку словаря, которая имеет меньшую величину, чем исходный фрагмент данных. Таким образом реализуется сжатие информации.

        Декодирование LZW-данных производится в обратном порядке. Декомпрессор читает код из потока данных и, если этого кода еще нет в словаре, добавляет его туда. Затем этот код переводится в строку, которую он представляет, и заносится в выходной поток несжатых данных.

        Ряд графических форматов, в том числе и один из базовых - TIFF - используют в своих современных версиях встроенное LZW-сжатие. В частности, этот формат использован для представления рисунков в данной книге. Достоинством этого метода для графических файлов является хорошее сжатие данных для любой глубины представления цвета, начиная от штриховых и кончая полноцветными изображениями. В частности, такое сжатие успешно используется в формате GIF с индексированными цветами (глубина цвета 8 бит). Оба эти формата будут описаны в данном разделе.

        В других случаях используется сжатие с регулируемой величиной потерь и переменным коэффициентом сжатия. Чем больше величина потерь, тем больше и коэффициент сжатия. Программа сжатия обычно делит все изображение на блоки размером 8x8 пикселов каждый. Уменьшение сжимаемого фрагмента позволяет уменьшить пропорционально квадрату его линейных размеров время обработки, т. е. деление на фрагменты эффективно увеличиваетскорость преобразования. Далее к значениям пикселов применяется формула, называемая дискретным косинусным преобразованием.


        Оно преобразует матрицу пикселов в матрицу значений амплитуд пространственного спектра изображения.

        Значения элементов полученной матрицы характеризуют различные составляющие спектра: левый верхний угол результирующей матрицы соответствует самым низким частотам пространственного спектра, а правый нижний - самым высоким. Коэффициент качества преобразования, введенный предварительно пользователем, используется при получении значений элементов матрицы квантования. Чем ниже коэффициент качества, тем большие будут значения у элементов последней матрицы. Далее каждый элемент матрицы амплитуд делится на соответствующий элемент матрицы квантования. Полученные в итоговой матрице значения округляются до ближайшего целого числа. В результате таких операций в правой нижней части итоговой матрицы будет тем больше нулевых элементов, чем ниже заданный пользователем коэффициент качества. Затем программа сжатия кодирует элементы последней матрицы, начиная от левого верхнего по строке до правого нижнего одним из методов кодирования без потерь, причем чем больше нулей в последней матрице, тем меньше окажется информационный объем сжатого файла. Величина коэффициента сжатия для этого метода изменяется в пределах от 10 до 100 в зависимости от заданного значения коэффициента качества.

        Декодирование сжатого описанным методом файла изображения начинается с шага обратного преобразования без потерь, в результате чего восстанавливается заключительная матрица, в которой содержится ряд нулевых элементов в правой нижней части. Затем значения элементов этой матрицы домножаются на элементы матрицы квантования, хранимой в самом сжатом файле. В результате получим восстановленную матрицу амплитуд пространственного спектра, значения которой отличаются отэлемен-тов исходной (они округлялись до целого значения в процессе сжатия с потерями), что и определяет отличия восстановленного изображения от исходного. Далее применяется обратное косинусное преобразование, в результате чего получим восстановленную матрицу значений пикселов, размер которой по-прежнему 8x8.


        В результате потери высокочастотных составляющих восстановленное изображение будет выглядеть более блеклым и размытым по сравнению с исходным.

        Далее остановимся на основных форматах графических файлов. Самым универсальным графическим форматом является TIFF, разработанный известной в компьютерном мире фирмой
        Aldus для хранения оцифрованных изображений больших размеров и высокого разрешения (в 1999 г. эта фирма вошла в состав еще более крупной фирмы
        Adobe, хорошо известной среди дизайнеров, издателей и полиграфистов всего мира своими программными пакетами для обработки растровой и векторной графики). Формат подходит для профессиональной работы художников с графикой и для факсимильной связи и передачи изображения, размером до несколько страниц. Формат обладает универсальностью и высокой гибкостью и хранит графические данные в структурированном виде, что позволяет графическим приложениям осуществлять быстрый поиск и загрузку нужных фрагментов изображения. В нем используется как полно-цветовое представление, так и представление с индексированными цветами. Он часто применяется для обмена различными типами графики. Однако размер графических файлов, представленных в этом формате, велик, что препятствует его использованию в электронных изданиях. Этот недостаток компенсируется в последних версиях формата применением эффективного встроенного LZW-сжатия, о котором было сказано выше.

        Graphic Interchange Format (GIF) компьютерной информационной службы
        CompuServe является одним из наиболее употребительных растровых форматов в электронных, в особенности сетевых, изданиях. Он был создан для упрощения обмена данными в локальных компьютерных сетях, при возможности отображения этих данных. Основных достоинств у формата два:



        • пригодность для различных платформ, т. е. формат является платформно-независимым;

          малый размер файлов благодаря использованию мощного алгоритма сжатия без потерь.

          Изображение записывается в этом формате с использованием RGB-цветовой модели и данных встроенной в файл палитры индексированных цветов.


          К сожалению, серьезным ограничением для этого формата является ограниченная глубина цвета, не превышающая 8 бит на пиксел. Важное достоинство этого формата состоит в том, что он позволяет хранить в одном файле несколько изображений. Современная версия GIF89a решила проблему обработки таких изображений, размещенных в одном файле, с помощью дополнительно включенного в файл блока управления графикой. Этот блок позволяет программе просмотра организовать взаимодействие каждого последующего изображения с текущим, что и обеспечило создание широко распространенных анимационных GIF-файлов.

          Графические данные в этом формате могут храниться как последовательно, строка за строкой, так и в формате, чередующем строки. В последнем случае рисунок первоначально строится на основе 1/8 части от общего описания, а в дальнейшем изображение «прорисовывается» все четче и четче.

          Растровый формате глубиной представления цвета до 48 битс использованием той же RGB-модели создан специальной группой разработчиков и получил название PNG (Portable Network Graphic - переносимый сетевой формат), что произносят как «пинг». Формат PNG изначально планировался как замена формату GIF, но с улучшенными возможностями представления цвета. Он, как и GIF, поддерживает чередование строк и ускоренную начальную загрузку файла. В нем используется улучшенный алгоритм сжатия информации. Кроме того, в формате поддерживается режим полупрозрачных корректирующих слоев, аналогичный используемым в векторном AI и растровом PSD форматах графических пакетов фирмы Adobe. Единственное ограничение формата PNG по сравнению с GIF состоит в невозможности хранения в одном файле нескольких изображений и, вследствие этого, отсутствии анимационных возможностей.

          Рассмотренные выше графические форматы содержали внутреннюю компрессию без потерь информации. Еще один формат, который относят к числу самых употребительных, характеризуется регулируемой величиной сжатия в зависимости от допустимой потери качества изображения. Этот
          формат разработан объединенной группой экспертов в области фотографии (Joint Photographic Experts Group) и назван аббревиатурой JPEG (расширение файлов JPG).


          Этот формат также растровый с глубиной цвета, равной 24 битам. Преимущественно используется цветовая модель HSL (Hue-Saturation-Lightness, или Оттенок-Насыщенность-Яркость). Алгоритм сжатия, используемый в таких файлах, носит название «алгоритм сжатия JPEG». Он был описан ранее в этом же разделе в качестве примера технологии сжатия с потерями в графических файлах. Различные его варианты использованы также при организации сжатия видеоданных (см. § 3.5).

          Графические программы, которые позволяют хранить данные в этом формате, обычно выводятспециальную линейку, на которой устанавливается значение параметра качества, изменяющегося в пределах от 0 до 10 (рис. 3.3
          ). Одновременно с непрерывным изменением коэффициента качества на линейке появляется дискретный параметр качества в форме целого числа в окне «Качество», а рядом в списковом окне - характеристика этого параметра. При значении от 0 до 2 качество «Низкое», 3-5 - «Среднее», 6-7- «Высокое» и 8-10 - «Наивысшее». На рисунке значение коэффициента качества равно б и качество «Высокое». При сохранении изображения можно установить «Разновидность формата» в позицию «Progressive», при которой величина чередования строк устанавливается в пределах от 3 до 5, что обеспечивает быструю начальную загрузку изображения низкого качества в сетевых структурах.

          Используемый в формате JPEG подход «сжатие с потерями» частично идентифицирует и удаляетту информацию, которая несущественна для восприятия изображения. Лишь при сжатии изображения с резко выраженными контурами линии начинают «дрожать». При высоких значениях коэффициента качества изображения этот эффект не проявляется. Возможно, в дальнейшем появится вариант формата с избирательной установкой коэффициента качества для различных фрагментов изображения, что позволит достигнуть высокого качества при очень высоких коэффициентах сжатия.

          В заключение этого раздела укажем последовательность графических форматов в порядке убывания их популярности (или частоты применения) для электронных изданий и документов: GIF, JPEG, PNG, TIFF.

          3.4.


          Содержание раздела