Если вам нужно индексировать не всю страницу целиком, например, чтобы исключить навигацию, рекламу и т.п., вы можете использовать команду BodyPattern чтобы указать шаблон для извлечения контента для индексирования. Например:
BodyPattern "<!--content-->(.*)<!--/content-->" "$1"этот шаблон будут извлекать контент между двумя специальными комментариями, и только этот контен будет проиндексирован для этой страницы.
Вы можете задать несколько команд BodyPattern, но только первая по порядку подходящая будет применена к странице. Эти команды пытаются примениться к каждой индексируемой странице. Осторожно, большое число таких команд может замедлить скорость индексирования.
Команда BodyBrackets аналогична команде BodyPattern, но задает два маркера: начала контента и конца контента, например:
BodyBrackets "<!--B-->" "<!--E-->"При этом фрагмент документа заключенный между <!--B--> и <!--E--> будет считаться телом документа.
Пред. | Начало | След. |
Комментарии | Уровень выше | Sub-documents |