Шрифт:
Интервал:
Закладка:
Имена элементов всегда учитывают регистр.
Информацию о правилах, управляющих элементами (например, что они могут быть вложенными соответствующим образом, конечный тэг закрывает все опущенные начальные тэги вплоть до соответствующего ему начального тэга и так далее), смотрите в стандарте SGML.
Например, следующий абзац:
<P> Это первый абзац. </P>
…элемент блока…
можно перезаписать без конечного тэга:
<P> Это первый абзац.
…элемент блока…
поскольку начальный тэг <P> закрывается следующим элементом блока. Точно так же записывают, если абзац включен в элемент блока, например:
<DIV>
<P> Это абзац.
</DIV>
конечный тэг включающего элемента блока (здесь – </DIV>) служит также конечным тэгом открытого начального тэга <P>.
Элементы – это не тэги. Иногда элементы называют тэгами (например, «тэг P»). Помните, что элемент – это одно, а тэг (не имеет значения, признак начала или конца) – другое. Например, элемент HEAD всегда присутствует, даже если начальный и конечный тэги HEAD отсутствуют.
Атрибуты
С элементами могут быть связаны свойства, называемые атрибутами, которые могут иметь значения (стандартные или устанавливаемые авторами или сценариями). Пары атрибут/значение помещаются перед закрывающей скобкой ">" начального тэга элемента. В начальном тэге элемента может содержаться любое число (допустимых) пар атрибут/значение, разделенных пробелами. Они могут указываться в любом порядке.
В данном примере для элемента H1 установлен атрибут id:
<H1 id=«section1»>
В результате имеем маркированный заголовок, благодаря атрибуту id </H1>.
По умолчанию в SGML необходимо, чтобы все значения атрибутов были разделены с помощью двойных (десятичный код ASCII 34) или одинарных (десятичный код ASCII 39) кавычек. Одинарные кавычки могут включаться в значение атрибута, если значение отделяется двойными кавычками, и наоборот. Авторы могут также использовать цифровые ссылки на символы для представления двойных (") и одинарных (') кавычек. Для двойных кавычек авторы могут также использовать character entity reference ".
В определенных случаях авторы могут указывать значение атрибута без кавычек. Значение атрибута может включать только буквы (a – z и A – Z), цифры (0 – 9), знаки переноса (десятичный код ASCII 45) и точки (десятичный код ASCII 46). Рекомендуется всегда использовать кавычки.
Имена атрибутов всегда учитывают регистр.
Значения атрибутов обычно учитывают регистр. Через определение каждого атрибута в списке атрибутов указывается, учитывать ли значение регистра.
Список всех атрибутов, определенных в этой спецификации, приводится в указателе атрибутов [10,11].
Ссылки на символы
Ссылки на символы – это числовые или символьные имена символов, которые могут быть включены в документ HTML. Они удобны для обращения к редко используемым символам или к символам, которые трудно или невозможно вводить в средствах разработки документов. Вы увидите ссылки на символы в этом документе; они начинаются со знака "&" и заканчиваются точкой с запятой (;).
Вот некоторые примеры:
– “<” представляет знак <.
– “>” представляет знак>.
– “"” представляет знак».
– “å” (десятичное число) представляет букву «a» с кружком сверху.
– “И” (десятичное число) представляет кириллическую букву «I».
– “水” (шестнадцатеричное число) представляет китайский знак воды.
Ссылки на символы в HTML подробно обсуждаются далее в разделе под заголовком «набор символов документа HTML». В спецификации также содержится список ссылок на символы, которые могут использоваться в документах в формате HTML 4.0.
Комментарии
Комментарии в HTML имеют следующий синтаксис:
<! – — это комментарий – >,
<! – — это тоже комментарий, он занимает несколько строк – >.
Пробелы между открывающим разделителем разметки (» <!») и открывающим разделителем комментария (» – ») недопустимы, но их можно использовать между закрывающим разделителем комментария (» – ») и закрывающим разделителем разметки (»>»). Распространенной ошибкой является включение в комментарий строки символов переноса (» – -»). Следует избегать использования в комментариях двух или более символов переноса.
Информация в комментариях не имеет специального значения (например, ссылки на символы не интерпретируются).
Что такое World Wide Web
World Wide Web (Web) – это сеть информационных ресурсов. Для того чтобы сделать эти ресурсы доступными наиболее широкой аудитории, в Web используются три механизма:
1). единая схема наименования для поиска ресурсов в Web (например, URI);
2). протоколы для доступа к именованным ресурсам через Web (например, HTTP);
3). механизм гипертекста для перемещения по ресурсам (например, HTML).
Связи между этими тремя механизмами становятся очевидными по прочтении этой спецификации.
Введение в URI
Каждый ресурс в Web – документ HTML, изображение, видеоклип, программа и т. д. – имеет адрес, который может быть закодирован с помощью универсального идентификатора ресурсов (Universal Resource Identifier), или URI.
URI обычно состоит из трех частей:
1). схема наименования механизма, используемого для доступа к ресурсу;
2). имя машины, на которой располагается ресурс;
3). имя собственно ресурса, заданное в виде пути.
Рассмотрите URI этой спецификации HTML на сервере ixBbase:
http://ixbase.info/ixbase/index.html
Этот URI может читаться следующим образом: этот документ можно получить по протоколу HTTP (см. [RFC2068]), он располагается на машине ixbase.info, путь к этому документу – “/ixbase/index.html». Кроме того, в документах в формате HTML Можно увидеть схемы «mailto» для электронной почты и «ftp» для протокола FTP.
Вот еще один пример URI. Он относится к почтовому ящику пользователя:
…текст…
Комментарии отправляйте <A href=“mailto:[email protected]»> A.Shevelev </A>.
Примечание. Большинство читателей уже знакомо с термином «URL», но не знает термина «URI». URL образуют подмножество более общей схемы наименования URI.
Идентификаторы фрагментов
Некоторые URI указывают на местоположение внутри ресурса. Этот тип URI заканчивается символом «#», за которым следует указатель (идентификатор фрагмента). Например, следующий URI указывает на фрагмент с именем section_2:
http://somesite.com/html/top.html#section_2.
Относительные URI
Относительный URI не содержит информации о схеме наименования. Путь в нем указывает на ресурс на машине, на которой находится текущий документ. Относительные URI могут содержать компоненты относительного пути (например,»..» означает один уровень выше в иерархии) и идентификаторы фрагментов.
Относительные URI приводятся к полным URI с помощью базового URI. В качестве примера приведения относительного URI предположим, что у нас имеется базовый URI “http://www.acme.com/support/intro.html”. Относительный URI в ссылке
<A href="suppliers.html»> Suppliers </A>
будет преобразован в полный URI “http://www.acme.com/support/ suppliers.html», а относительный URI в фрагменте
<IMG src=“../icons/logo.gif» alt=«logo»>
будет преобразован в полный URI
«http://www.acme.com/icons/logo.gif”.
В HTML URI используются для:
– ссылки на другие документы или ресурсы (см. элементы A и LINK);
– ссылки на внешние таблицы стилей или скрипты (см. элементы LINK и SCRIPT);
– включения в страницу изображений, объектов или апплетов (см. элементы IMG, OBJECT, APPLET и INPUT);
– создания изображений-карт (см. элементы MAP и AREA);
– отправки форм (см. FORM);
– создания документов с использованием кадров (см. элементы FRAME и IFRAME);
– ссылок на внешние источники (см. элементы Q, BLOCKQUOTE, INS и DEL);
– ссылок на соглашения о метаданных, описывающих документ (см. элемент HEAD).
Подробнее об URI см. в разделе о типах URI.
Что такое HTML
Чтобы представить информацию для глобального использования, нужен универсальный язык, который понимали бы все компьютеры. Языком публикации, используемым в World Wide Web, является HTML (HyperText Markup Language – язык разметки гипертекстов).
HTML дает авторам средства для:
– публикации электронных документов с заголовками, текстом, таблицами, списками, фотографиями и т.д.;
– загрузки электронной информации с помощью щелчка мыши на гипертекстовой ссылке;
– разработки форм для выполнения транзакций с удаленными службами, для использования в поиске информации, резервировании, заказе продуктов и т.д.;
– включения электронных таблиц, видеоклипов, звуковых фрагментов и других приложений непосредственно в документы.
Сколько страниц и сайтов вы успели посетить за время пребывания в глобальной сети? Кто-то больше, кто-то меньше. А задумывались ли вы над тем, что представляет собой каждая страница, пробовали заглянуть внутрь сайта?
Все сайты в сети можно разделить на две большие группы: статические и динамические сайты. С точки зрения посетителя сайта порой не важно, на какой странице он находится, статической или динамической, иногда даже трудно точно это определить. Но рассмотрим такое разделение с точки зрения разработчика – создателя сайта.