HTML-парсер распознает гипертекстовые ссылки следующих типов:
<A HREF="xxx">
<A HREF="xxx" DATA-EXPANDED-URL="yyy" DATA-ULTIMATE-URL="zzz">
Приоритет атрибутов при выборе ссылки: data-ultimate-url, data-expanded-url, href.
<IMG SRC="xxx">
<LINK HREF="xxx">
<FRAME SRC="xxx">
<AREA HREF="xxx">
<BASE HREF="xxx">
Замечание: Если <BASE HREF> содержит некорректно сформированный URL, то для формирования относительных ссылок будет использовано текущее расположение документа.
Однако вы можете указать список HTML тэгов, которые будут пропущены при поиске новых ссылок, при помощи команды SkipHrefIn.
SkipHrefIn "img, link, script"
По умолчанию, DataparkSearch не учитывает ссылки с атрибутом rel=nofollow. Но вы можете изменить это поведение при помощи команды "DisableRelNoFollow yes", которую необходимо указать в файле конфигурации indexer.conf.
Пред. | Начало | След. |
META-тэги | Уровень выше | Комментарии |