Общая характеристика и структура HTML-документа
На заре компьютеризации приходилось работать с простыми текстовыми редакторами, такими как WordStar, для которых информация, отображаемая на экране, отличалась от выводимой на бумагу с помощью принтера. В текст документа вставлялись специальные управляющие символы, которые не отображались на экране, но обеспечивали вывод на печать в нужном формате отдельных фрагментов документа. При форматировании одна группа символов определяла начало фрагмента, затем следовал текст, к которому применялось это форматирование, а после него следовали символы конца фрагмента. Так задавались разрядка, курсив, полужирный шрифт и пр. Аналогичные способы применялись и при работе с первыми версиями СУБД dBase (например, dBase II), о чем автор может судить по своему личному опыту.
Тот же принцип положен в основу структуры
HTML-документа, однако управляющие символы, которые здесь называются тегами, определяют особенности отображения информации, выводимой уже не на принтер, а на экран монитора. Значительная часть таких тегов используется парами: вначале открывающий тег, затем объект управления, а в конце - закрывающий тег. Такая конструкция называется контейнером, так как объект форматирования размещается внутри нее. Некоторые теги принципиально не нуждаются в паре. Примером может служить тег принудительного перевода строки. Тег может включать в себя некоторые параметры (атрибуты), которые размещаются непосредственно после имени тега. Если параметров несколько, то в качестве разделителей используются пробелы.Для просмотра HTML-документов используют специальные программы, которые называются браузерами (Browser, т. е. средство просмотра в дословном переводе). Такие программы нуждаются в графической оболочке. В частности, значительное число браузеров (Microsoft Internet Explorer, Netscape Communicator, Opera и др.) работают в среде Windows 95, 98 и 2000.
Популярность
языка HTML росла вместе с развитием сети Интернет. Отсутствие в течение некоторого времени стандартов на язык HTML привело к тому, что некоторые браузеры отображали должным образом не все теги, а в версиях различных фирм одни и те же теги могли трактоваться неодинаково или даже не поддерживались.Широкое использование HTML-документов в сети Интернет привело к появлению международных стандартов на этот язык, называемых спецификациями языка HTML. Этой работой занялась широко известная организация World Wide Web Consortium (W3C). Первой из спецификаций, признанной большинством компаний-разработчиков, явилась HTML 2.0, представленная в конце 1995 г. Вскоре была выпущена предварительная (рабочая) версия спецификации 3.0, а в мае 1996 г.- проект спецификации HTML 3.2. После длительного обсуждения и исправления в январе 1997 г. эта спецификация стала официальной рекомендацией для разработчиков HTML-документов и браузеров. В декабре 1997 г. официальной рекомендацией стала спецификация HTML 4.0, которая остается в действии до настоящего времени.
Основой спецификации HTML 4.0 стало отделение параметров описания документов от параметров представления отдельных его фрагментов на экране монитора. Такое разделение облегчает адаптацию языка к различным платформам передам (Windows, UNIX, DOS и пр.) и упрощает процесс внесения изменений в документы. В соответствии с такой концепцией для описания документа следует использовать таблицу стилей, причем это понятие сходно с используемым в современных текстовых редакторах, таких как Word 97 или 2000. Использование же данных о форме представления документа вперемежку с содержанием самого документа не рекомендуется.
Спецификация HTML 4.0 отменяет ряд ранее использовавшихся тегов. Отмена тега означает, что этот тег по-прежнему поддерживается браузерами, но его применение в современных документах не рекомендуется. В дальнейшем такие теги могут быть переведены в разряд устаревших, которые уже могут не поддерживаться браузерами. Информация такого рода может быть получена на сайте http://www.w3.org/TR/.
Любой HTML-документ заключен в контейнер <HTML> и </HTML>. Сам документ, как уже говорилось выше, представляет собой обычный текстовый файл. Его можно просматривать в DOS'e с помощью стандартных редакторов и средств просмотра текстовых документов, при этом вместе с самим текстом мы будем видеть и теги.
Структурно документ распадается на две части: заголовочную и основную, ил и тело документа. Первая часть находится внутри контейнера <HEAD> и </HEAD>, а основная часть - внутри контейнера <BODY> и </BODY>.
Единственный обязательный тег, который используется в заголовочной части,- <ТIТLE>, причем он образует контейнер, внутри которого размещается текст заголовка. При загрузке документа в браузер текст заголовка загружается в первую очередь в окно заголовка браузера. Если текст заголовка достаточно информативен, пользователь в процессе поиска релевантных документов уже на этапе загрузки документа может определить, действительно ли ему нужен этот документ, а если не нужен, то сразу отказаться от его загрузки и перейти к загрузке следующего. Текст названия используется и при создании закладки для данного документа, с этой точки зрения также очень важна его информативность.
Многие HTML-документы связаны друг с другом, и ссылки от одного документа на другие могут быть абсолютные и относительные, причем последние формируются относительно того каталога, в котором расположен документ - источник ссылки. Абсолютные ссылки длинные, а относительные - перестают работать при перемещении основного документа. Можно включать сразу обе ссылки, чтобы связи между документами не нарушались в любых условиях.
Для формирования ссылок в заголовочной части применяется тег <ВАSЕ>, в котором используется один единственный параметр HREF, в качестве значения которого указывается URL (Universal Resours Locator) - адрес файла, на который производится ссылка. Адрес может быть локальным, т. е. задавать размещение файла в каталогах и подкаталогах на том же самом компьютере, или сетевым, например <BASE HREF='http:// www.uprint.spb.ru/main.htm'>.
Для организации логической связи и соподчиненности электронных изданий может использоваться тег <LINK>. В этом теге могут использоваться четыре параметра: HREF, REL, REV и TYPE. С помощью первого из них задается URL связанного с данным документа.
Параметр REL определяет вид отношения между текущим и связанным с ним документом, a REV -обратное отношение (между другим и текущим документами). Последний параметр TYPE задает тип и параметры присоединяемой к документу таблицы стилей. Примеры тега <LINK>:
<LINK REL='contents' HREF='(адрес)'>
<CLINK HREF='mailto: (адрес автора)' REV='made'>
Другими значениями параметра REL могут быть bookmark, copyright, glossary, help. Значение made параметра REV является признаком обратного отношения. Другие его значения: autor, editor, publisher.
Позднее в состав заголовочной части был добавлен специальный тег <МЕТА>, с помощью которого задается метаинформация, связанная с данным электронным изданием, или атрибуты для ускоренного поиска. Частные случаи метаинформации - это имя автора, издателя, редактора, название издательства, время публикации и другие характерные признаки издания. Тег <МЕТА> имеет два параметра: NAME, которым задается имя атрибута, и CONTENT, определяющий значение этого атрибута. Например:
<MЕТА NAME='author' CONTENT='B. А. Вуль'>
<СМЕТА NAME='description' СОМТЕМТ='Электронные издания'>
Как нам кажется, приведенные примеры не нуждаются в каких-либо комментариях.
Итак, внутри контейнера <HEAD> и </HEAD>, ограничивающего заголовочную часть HTML-документа, обычно используется один контейнер <TITLE> и </TITLE>, внутри которого размещается текст заголовка, и могут быть включены теги <BASE>, <LINK> и <МЕТА>. Отметим, что HTML-документ, содержащий только заголовочную часть, будет нормально отображаться браузерами как пустой документ. Пример такого документа представлен на рис. 2.1. А ниже показан соответствующий этому документу HTML-код:
<HTML>
<HEAD><ТIТLE>Пустой документ </TITLE></HEAD>
<BODY></BODY>
</HTML>
2.2.