4.6. Шаблоны для индексирования

Если вам нужно индексировать не всю страницу целиком, например, чтобы исключить навигацию, рекламу и т.п., вы можете использовать команду BodyPattern чтобы указать шаблон для извлечения контента для индексирования. Например:

BodyPattern "<!--content-->(.*)<!--/content-->" "$1"
этот шаблон будут извлекать контент между двумя специальными комментариями, и только этот контен будет проиндексирован для этой страницы.

Вы можете задать несколько команд BodyPattern, но только первая по порядку подходящая будет применена к странице. Эти команды пытаются примениться к каждой индексируемой странице. Осторожно, большое число таких команд может замедлить скорость индексирования.

Команда BodyBrackets аналогична команде BodyPattern, но задает два маркера: начала контента и конца контента, например:

BodyBrackets "<!--B-->" "<!--E-->"
При этом фрагмент документа заключенный между <!--B--> и <!--E--> будет считаться телом документа.