Использование метаданных (команда META)
при создании HTML документов
META команды (описания-инструкции) управляют действиями браузеров, серверов и могут быть использованы для совершенствования информации, выдаваемой обычными заголовками.
Команды META могут дать такой же эффект, что и реальный HTTP-заголовок ответа сервера. Описание HTTP-заголовка ответа дано в RFC1945 (протокол HTTP/1.0) и RFC2068 (протокол HTTP/1.1).
Когда HTML документ запрашивается броузером, сервер, на котором лежит данный текст смотрит в содержимое метатэгов и вписывает в соответствующие поля HTTP пакетов необходимые значения. Соответственно, не все эти тэги будут работать в локальной системе (минуя вебсервер).
Команда META (тэг) имеют два возможных атрибута | ||
<META HTTP-EQUIV=" " CONTENT="содержимое"> | ||
<META NAME=" " CONTENT="содержимое"> |
Значение: Expires |
Дата устаревания документа. Управление кэшированием у клиента в HTTP/1.0. В Netscape Navigator это выглядит следующим образом: если указанная дата прошла, то очередной запрос этого документа вызывает повторный сетевой запрос, а не подгрузку документа из кэша. Дата со значением "0" интерпретируется как "текущее_время". Такое значение заставляет браузер каждый раз при запросе проверять - изменялся ли этот документ. Это, кстати относится и к прокси-агентам. Поисковые роботы могут либо совсем не индексировать такой документ, либо постоянно "просматривать" его. Дата должна быть задана в формате, описанном в RFC850 (стандартная запись Даты для UNIX систем), |
<META HTTP-EQUIV="expires" CONTENT="Wed, 26 Feb 2000 08:21:57 GMT"> |
Значение: Pragma |
Контроль кэширования для протокола HTTP/1.0. Значение может быть только одно "no-cache" (не кэшировать данный документ). |
<META HTTP-EQUIV="Pragma" CONTENT="no-cache"> |
Значение: Content-Type |
Указание MIME-типа документа. Может быть расширено указанием кодовой страницы документа (charset). Если же указывать charset в содержании команды META, то Netscape Navigator и MSIE выводят данный документ уже в заданном charset. Однако будьте аккуратны, если текст документа в кодировке Windows имеет значение charset=KOI8-r, то никакими силами пользователь не сможет поменять encoding, чтобы увидеть нормальный русский текст! |
<META HTTP-EQUIV="Content-type" CONTENT="text/html; charset=ISO-8859-5"> <META HTTP-EQUIV="Content-type" CONTENT="text/html; charset=windows-1251"> <META HTTP-EQUIV="Content-type" CONTENT="text/html; charset=koi8-r"> |
Значение: Content-language |
Указание языка документа. Может использоваться поисковыми машинами при индексировании страниц. Комбинация поля Accept-Language (посылаемого браузером) с содержимым Content-language может быть условием выбора сервером того или иного языка. Язык описывается парой значений (язык-диалект). Можно использовать только фиксированные коды языков, например:
|
<META HTTP-EQUIV="Content-language" CONTENT="en-GB"> |
Значение: From |
Электронный адрес, куда можно отослать инфу о возможных ошибках при скачивании документа. Контактный адрес. |
<META HTTP-EQUIV="From" CONTENT="mail=madi@mailru.com"> |
Значение: Location |
Местоположение документа. Параметр - полный адрес документа в Интернете. Этот тэг иногда используется для автоматической переадресации в нужное место. |
<META HTTP-EQUIV="Location" CONTENT="url=http://madi.ussr.to"> |
Значение: Refresh |
Определение задержки в секундах, после которой браузер автоматически обновляет документ.
Дополнительная возможность - автоматическая загрузка другого документа.
|
<META HTTP-EQUIV="Refresh" CONTENT="5;url=http://madi.ussr.to"> |
Значение: Window-target |
Определяет окно текущей страницы; может быть использован для прекращения появления новых окон браузера при применении фреймовых структур. Действует для многих (но не для всех) браузеров. |
<META HTTP-EQUIV="Window-target" CONTENT="_top"> |
Значение: Ext-cache |
Определяет имя альтернативного кэша для просмотрщика. |
<META HTTP-EQUIV="Ext-cache" CONTENT="name=/some/path/index.db; istructions=User Instructions"> |
Значение: PICS-Label |
Документы, имеющие URL, могут быть категоризованы, через PICS-Label привязку. Обычно используется для определения рейтинга "взрослости" (adult) содержания (sex,violence, ...). |
<META http-equiv="PICS-Label" content='(PICS-1.1 "http://vancouver-webpages.com/VWP1.0/" l gen true comment "VWP1.0" by "scott@hisdomain.com" on "1997.10.28T12:34-0800" for "http://www.hisdomain.com/" r (P 2 S 0 SF -2 V 0 Tol -2 Com 0 Env -2 MC -3 Gam -1 Can 0 Edu -1 ))'> |
Значение: Cache-Control |
Определяет действия кэша по отношению к данному документу. Возможные значения:
|
Значение: Vary |
Определяет доступные альтернативы для указанных в CONTENT полей HTTP-заголовка. |
<META HTTP-EQUIV="Vary" CONTENT="Content-language"> |
Команда META с атрибутом NAME используются в случаях, когда поля не соотносятся с HTTP -заголовками. Принципиально нет никаких ограничений на использования значений этого атрибута, за исключением того, что существует негласная договоренность между создателями поисковых машин и роботов о том как использовать некоторые из них. Ниже приводятся наиболее употребимые значения этого атрибута.
Значение: Robots |
Управление индексацией страницы для поисковых роботов. <META NAME="robots" CONTENT="all | none | index | noindex | follow | nofollow">
|
<META NAME="robots" CONTENT="follow"> |
Значение: Description |
Краткая аннотация содержания документа. Используется поисковыми системами для описания документа.
Задание этого значения полезено в случаях, когда в документе мало текста, когда это управляющий фреймами файл (frameset) или в начале документа используются скрипты. Длина текста до 255 символов. |
<META NAME="description" CONTENT="Индексирование гипертекстовых документов WWW с помощью инструкций МЕТА".> |
Значение: Keywords |
Используется поисковыми системами для индексирования документа. Обычно здесь указываются синонимы к словам в заголовке (title) или альтернативный заголовок. Длина списка до 1000 символов. Не допускается использование одного и того же ключевого слова более 7 раз, поисковые системы просто будут игнорировать это слово. |
<META NAME="keywords" CONTENT="META, HTML, WWW, Web, паутина, поиск, определение, рекомендации, примеры использования, учебник, руководство, информация, справка"> |
Значение: Document-state |
Управление индексацией страницы для поисковых роботов. Определяет частоту индексации - или один раз индексировать, или реиндексировать документ регулярно. Возможные значения:
|
<META NAME="Document-state" CONTENT="Dynamic"> |
Значение: Author |
Имя автора документа, формат текстовый. |
<META NAME="Author" CONTENT="Абдулгафаров Мади"> |
Значение: Generator |
Обычно название и версия редактора, с помощью которого создана эта страница. Может быть использована для определения доли рынка, занимаемого тем или иным продуктом. |
<meta name="GENERATOR" content="Microsoft FrontPage 3.0"> |
Значение: Copyright |
Обычно описание авторских прав на документ в текстовом формате. |
<meta name="Copyright" content="Copyright 2000 Madi [madi@mailru.com]"> |
Значение: Resource-type |
Текущее состояние данного файла. Важен для поисковых систем, т.е. если его значение document, то поисковая система приступает к его индексированию. |
<meta name="Resource-type" content="document"> |
Примерный вид описаний Meta в HTML документе
<meta http-equiv="Content-Type" content="text/html; charset=windows-1251">
<meta http-equiv="bulletin-date" content="TYPE-HTTP">
<meta http-equiv="reply-to" content="madi@mailru.com">
<meta http-equiv="Window-target" content="meta">
<meta name="author" content="Madi Abdulgafarov">
<meta name="classification" content="Описание HTML">
<meta name="copyright" content="Madi's soft">
<meta name="distribution" content="GLOBAL">
<meta name="keywords" content="meta html энциклопедия справочник краткий тэги обновление тэг meta http пример описание примеры поля справочник значение поисковик индексация робот индексирование ключевые слова equiv Абдулгафаров Мади">
<meta name="description" content="Когда HTML документ запрашивается броузером, сервер, на котором лежит данный текст смотрит в содержимое метатэгов и вписывает в соответствующие поля HTTP пакетов необходимые значения. Соответственно, не все эти тэги будут работать в локальной системе (минуя вебсервер).">
<meta name="language" content="russian">
<meta name="rating" content="SAFE FOR KIDS">
<meta name="revisit-after" content="35 days">
<meta name="robots" content="FOLLOW">