Версии DataparkSearch 2005


Последние версии.
02 Дек 2005: 4.35, 1,988,950 байт, 20.11.2012, 00:45 MSK
Добавлен Алгоритм Построения Рефератов (SEA).
Исправлен возможный трап при обработке robots.txt с некорректным значением в заголовке Content-Encoding.
Добавлена таблица robots для кэширования данных файлов robots.txt на период, заданый командой RobotsPeriod.
Некоторые улечшения скорости индексирования.
В таблицу qtrack добавлен новый столбец wtime, в который записывается число миллисекунд, затраченых на поиск. При апгрейде, необходимо добавить этот столбец (например, при помощи команды ALTER TABLE), или создать таблицу <qtrack заново.
Исправлена синтаксическая ошибка в скрипте создания базы MySQL.
Исправлена обработка команды Subnet для сетей в CIDR формате.
Исправлена утечка памяти при построении всех форм слов используя ispell-данные.
Реализовано более аккуратное разбиение фраз на слова для запросов в кодировке UTF-8.
Добавлены карты нескольких языков в кодировке UTF-8.
Исправлено разбиение фраз поискового запроса на слова при кодировке UTF-8 в BrowserCharset.
31 Окт 2005: 4.34, 2,042,475 байт, 20.11.2012, 00:45 MSK
Исправлено разбиение на слова фраз смешанного западного и восточного письма.
Добавлен ключ -d для indexer. Используйте его для сортировке страниц при индексировании по Popularity Rank.
Добавлена команда ExpireAt для указания точного времени устаревания документов.
Добавлена поддержка команды Crawl-delay в файле robots.txt.
Переписан внутрений парсер text/xml, библиотека libexpat больше не требуется.
Добавлена команда HTDBText для виртуальной схемы htdb:/ индексирования SQL-баз.
Улучшен сегментер для китайского, корейского и тайского языков.
Исправлена нерешенная ссылка на dps_memmove.
Исправлен трап при пустой фразе для поиска.
Немного улучшена скорость подсчёта полной релевантности.
Исправлен трап, нечасто случавшийся при обновлении карт языков.
Исправлен подсчёт неравномерности распределения слов запроса при расчёте релевантности.
Исправлена кодирока, используемая с MeCab.
Paranoia-проверка стэка расширена для случая компиляции с оптимизацией.
Испарвлены некоторые баги.
16 Сен 2005: 4.33, 1,999,275 байт, 20.11.2012, 00:45 MSK
Добавлен поисковый шаблон OpenSearch 1.0.
Исправлено выделение слов из запроса для переменных шаблона вида $^(x).
Улучшено построение цитат документов.
Исправлена перекодировка цитат документов в случае если не используется stored "DoStore yes"
Испарвлена обработка команд ExcerptSize и ExcerptPadding при использовании searchd.
Добавлен параметр &charset для команды DBAddr.
Исправлена небольшая утечка памяти при расчёте Neo PopRank.
Добавлена автоматическая коррекция индексируемых слов. Используйте команду "AspellExtensions yes" для включения. Необходима установка aspell.
Добавлена автоматическая коррекция правописания слов запроса. Необходима установка aspell на вашем PC.
Исправлена перекодировка запроса поиска при использовании searchd.
Добавлен режим поиска "near". Этот режим аналогичен режиму поиска "все", но находит документы в которых искомые слова стоят не далее 16 слов друг от друга.
Для булевого поиска добавлен оператор NEAR. Оператор принимает истинное значение если два слова стоят не далее 16 слов друг от друга.
Добавлены команды поискового шаблона GrBeg и GrEnd. Используйте эти команды для выделения последовательно идущих результатов с одного сайта при групировке а-ля Google.
Исправлен возможный трап indexer при включённой поддержке IDN.
Исправлено значение метапеременной $(PerSite) для случая кэшированых результатов поиска.
Добавлена поддержка библиотеки libares.
Исправлены некоторые баги (включая #168).
17 Июн 2005: 4.32, 1,978,991 байт, 20.11.2012, 00:45 MSK
Исправлен поиск всех синонимов.
Исправлена обработка белевого оператора NOT в случае, когда не найдено документов для удаления.
Изменён алгоритм полного варианта расчёта релевантности для увеличения скорости и коректировки значения в случае задания большого числа секций документов.
Настроено автоматическое определение языка и кодировки на случай противоречивых данных в заголовках ответа сервера и в мета тэгах.
Ключ --with-bestavgpos для configure переименован в --with-bestpos.
Испарвлена обработка сложных поисковых запросов с акронимами и стопловами.
В скрипт dps_config добавлены флаги, относящиеся к MeCab.
Исправлен возможный трап при поиске незакрытой вложеной фразы.
Команда Subnet теперь принимает подсети в форматах: a.b.c.d/m, a.b.c, a.b, a
Исправлена обработка robots.txt для случа когда секция User-Agent: * разделена на две и более частей.
Исправлен неожиданый выход indexer при cache dbmode если не используется cached.
Для шаблонов поиска добавлена мета-переменная $(FancySize), выводящая размер документа в байтах, килобайтах или мегабайтах, что больше подходит.
Добавлена группировка результатов а-ля Google, используйте ключ --enable-googlegrp для configure чтобы включить.
Исправлен возможный трап в случае, когда в поисковом запросе фраза указана в середине.
Испправлен возможный трап search.cgi в случае, когда в шаблоне использована команда Locale.
Исправлены некоторые баги (#164).
17 Июн 2005: 4.31, 1,972,057 байт, 20.11.2012, 00:45 MSK
Восстановлен поиск crosswords для sql ориентированых способов хранения.
Исправлена обработка robots.txt при использовании gzip и deflate кодирования содержимого.
Исправлен возможный трап при использовании булевского поиска.
Исправлен тип сравнения по умолчанию для команд ServerDB и SubnetDB.
Данные о символах Unicode обновлены до версии 4.1.0.
Исправлено выделение слов из поискового запроса при показе сохранённой копии документа.
Реализовано более экономичное выделение памяти под документы при индексировании.
Исправлены некоторые баги.
31 Май 2005: 4.30, 1,964,115 байт, 20.11.2012, 00:45 MSK
Добавлена команда PopRankPostpone. Используйте её для пропуска расчёта Neo PopRank при индексировании.
Добавлен нечёткий поиск на основе аббревиатур и акронимов.
Исправлена команда FlushServerTable.
Исправлен скрипт создания базы для Oracle.
Добавлен команда Locale для шаблонов поиска. Используйте её для задания LC_ALL локали при выводе результатов поиска.
Переписана обработка поисковых запросов.
Восстановлено пропущенное вычисление номера страницы в mod_dpsearch.
Проверка базы Cached оптимизирована по скорости.
Добавлена карта индонезийского языка для кодировки ISO-8859-1.
Исправлены некоторые баги.
08 Мар 2005: 4.29, 1,938,547 байт, 20.11.2012, 00:45 MSK
Некоторые большие файлы синонимов и частотных словари исключены из дистрибутива. Вы можете их скачать отдельно с нашего сайта.
Добавлены списки синонимво английского, немецкого и польского языков.
Добавлен режим тезауруса дял файлов синонимов.
Исправлен баг нумерации секций при задании весов секций во время поиска.
Добавлена переменная шаблона $(WS), она отображает статистику слов запроса в короткой форме.
Устранена возможная утечка памяти при сбросе пустого буфера cached.
Добавлены карты персидского языка (фарси) для кодировок ISIRI-3342 и UTF-8.
Исправлено ошибка обработки ключа -w у splitter.
Исправлена ошибка установки mod_dpsearch.so для Apache 2.0.53.
Добавлены карты маорийского и мальтийского языков в кодировках ISO-8859-1 и UTF-8.
Добавлены новые ключи для configure: --disable-reldistance, --disable-relposition, --disable-relwrdcount, --with-bestavgpos, --with-wrdcntfactor. Используйте эти ключи для настройки расчёта релевантности.
Добавлена поддержка для Google's anti comment spam initiative.
Команды IndexIf, NoIndexIf теперь могут быть загружены из таблицы серверов при помощи команды ServerTable.
Исправлено возможное зависание при расчёте Neo PopRank.
Исправлены некоторые баги (включая #158).
17 Янв 2005: 4.28, 3,459,009 байт, 20.11.2012, 00:45 MSK
Исправлено выделение слов запроса для кэшированых результатов поиска.
Изменён протокол stored. Полуйста, перезапустите stored при апгрейде.
Команды TagIf и CategoryIf теперь могут быть загружены из таблицы серверов с помощью команды ServerTable.
Исправлен поиск библиотеки libidn в configure.
Испралена загрузка частотных словарей в searchd.
Исправлено ошибка показа кэшированых документов в случае, когда stored не используется.
Изменён алгоритм Relevancy для запросов с двумя и более словами.
Добавлена команда URLCharset. Используйте её для задания кодировки только для аргументов команд Server, Realm или URL.
Добавлены команды ServerDB, RealmDB, SubnetDB и URLDB. Эти команды аналогичны командам Server, Realm, Subnet и URL соответсвенно, но аргументы выбирают из указаного поля SQL-таблицы.
Исправлены некоторые баги.


Geo Visitors Map who's online