Команды поискового движка

A

aa » учет синтаксиса при поиске

allow_partial » допускать пропуск слов паттерна запроса

allow_audio » извлекать текстовые тэги (комментарии) из аудио-файлов

allowraw » пытаться извлечь текстовую информацию из файлов неизвестного формата

allow_gfx » извлекать текстовые тэги (комментарии) из графических файлов

allow_video » извлекать текстовые тэги (комментарии) из видео-файлов

allow_exec » извлекать информацию о версии из исполняемых файлов


C

case » учитывать регистр букв при поиске

cdrom » искать на CD/DVD

correlate » проверка грамматического согласования

cp  » задание кодировки для документов


D

dcache » управление кэшем распакованных файлов

dir »  задание области поиска: каталоги для просмотра

distance »  задание максимального расстояния между словами при фиксации контекста

dynforms » включение сложного морфологического анализатора

datamine freq » автореферирование документа

datamine topic » выявление темы документа


E

echo_topic » печатать категории документов

empty » отбирает пустые файлы

engine » обращение к внешнему поисковику

exec » исполнение команд для найденных файлов


F

file » задание области поиска: отдельные файлы

flist »  задание области поиска: файл со списком имен файлов для обработки

force_txt » считать, что файлы в формате plain text


H

href »  следовать по гиперссылкам при сканировании веб-страниц

httpd »  управление HTTP сервером

hidden_query_fields » задание параметров для GET-запроса


I

ignore_contents »  не анализировать содержимое файлов

iname »  фильтр: задание маски для имени файла без учета регистра

index » управление индексатором

       index create_domain » объявление нового индекса
       index delete_domain » удаление индексной БД
       index dir » размещать индексную базу в указанной папке
       index domain » задание рабочего индекса
       index domains » вывод списка всех индексов
       index delete_all » удаление всех индексов
       index info » статистическая информация об индексе
       index proximity » сохранение сведений о расположении слов в БД
       index purge » очистка индексной БД
       index reindex » переиндексация изменившихся документов
       index refresh » переиндексация изменившихся документов
       index off » отключение индексатора
       index on » разрешение индексатора
       index stopwords » режим использования стоп-слов
       index touchfiles » искать контексты фиксации в исходных документах
       index wordforms » учитывать морфологию при индексировании
       index dynforms » усложненная морфология при индексировании
       index frequency » сохранять в индексе частотные характеристики документов
       index calc_freq_rank » при поиске по индексу вычислять вес документов
       index totals » вывод общей статистики по всем индексам
       index topic » сохранять в индексе рубрикацию документов
       index backup » резервное сохранение базы данных
       index restore » восстановление базы данных из резервной копии
       index files:FFF » печать списка проиндексированных файлов
       index unlock_all » снятие всех блокировок в индексной базе
       index unlock » снятие блокировки у одного индекса
       index import » импорт описаний индексов с сервера
       index share » включение общего доступа для индекса
       index storecontents » сохранять текстовое содержимое документов в индексной базе
       index store_metainfo » сохранять в базе теги файлов
       index show_metainfo » показывать теги для найденных документов
       index unshare » выключение общего доступа для индекса
       index list_shared » получение списка индексов с общим доступом
       index add
» добавление документов в индекс


L

lan » искать в доступных в локальной сети ресурсах

language » загружать морфологические анализаторы только для указанных языков

lexems_margin » формирование отображаемого контекста фиксации - число показываемых лексем

listfiles » формирование результатов поиска в разных форматах

links » фильтр типов связей при сопоставлении по тезаурусу

locate » поиск ключевых слов везде


M

maxdepth » максимальное число последовательных скачков по гиперссылкам

modif » фильтр: дата модификации файла

mycomp » искать на всех дисках компьютера

mydocs » искать в папке "Мои документы" текущего пользователя

minbound » минимальная достоверность принимаемых результатов

maxtraffic » ограничение на использованный интернет-трафик

multiword » поиск слов из справочника в документах

maxhitcount » максимальное кол-во находимых контекстов при поиске


N

name » фильтр: задание маски для имени файла

notname » фильтр: задание маски для имен игнорируемых файлов

O

ocr » включать подсистему распознавания

ok » исполнять для каждого найденного файла команду с подтверждением

onceperfile » искать все контексты в каждом файле или только первый

ordered » строго следовать заданному в запросе порядку слов паттерна


P

prefer_cp » список предпочитаемых кодировок документов

preprocess » доп. обработка текста до поиска/индексирования

printfn » печатать список имен найденных файлов на консоли


Q

query_filemasks » маски файлов для индексного описка


R

raw_ext » расширения двоичных файлов для извлечения текста

recurse »  рекурсивно обходить подкаталоги

regex » паттерн запроса - регулярное выражение

rename » переименование индекса

report » статистический анализ обрабатываемых документов

rx » паттерн запроса - набор регулярных выражений для слов

rooting » при сравнении отбрасывать аффиксы (сравнивать корни)


S

same_domain » при следовании по гиперссылкам не выходить за рамки исходного домена

sample » паттерн запроса - набор слов

semnet » работа с семантической сетью

set_comment » задание комментария для индекса

showcontext » найденные контексты печатать в консоли

soundex » нечеткий поиск

size » фильтр: размер файла

stems » использовать стемминг при поиске

store_all_files » обрабатывать все файлы (не только текстовые)

store_download » распакованные и скачанные файлы сохранять во временном каталоге

strip_accents » убирать диактрические значки (акценты)

stripdecor » обработка тэгов разметки в HTML и XML

sort » сортировка результатов поиска по разным критериям

subst_shares » делает файловые пути в результатах сетевыми


target_content » искать в содержимом документа

target_filename » искать в именах файлов

topic_db администрирование с авторубрикатора

     topic_db load_xml FFF » задание списка рубрик

     topic_db train FFF » обучение авторубрикатора

     topic_db dump_topics » вывод списка рубрик

     topic_db dump_topic TTT » вывод логики для заданной рубрики

     topic_db purge » полная очистка БД рубрикатора

     topic_db save_xml FFF » сохранение базы рубрикатора в XML файле

translit » использовать транслитерацию

try_translit » при поиске использовать транслитерированную форму запроса


U

unpack » разрешение обрабатывать архивы

uri » область поиска: HTTP, FTP серверы

urimask » регексп-фильтры на гиперссылки

urinotmask » запрещающие регексп-фильтры на гиперссылки


V

verbose » печатать разнообразную информацию в консоли по ходу поиска

version » напечатать текущую версию поискового движка


W

whereis » файловый поиск везде

wildcards » упрощенные регулярные выражения с символами * и ?

wordforms » включать учет морфологии при поиске


 

Дополнительные материалы

Процедурный API поисковой системы

Где скачать поисковую систему и SDK

Скачать SDK поисковой системы с примерами и другие компоненты можно здесь поисковая система

  © Mental Computing 2010
изменено 07-Jun-10