Версии словарей для грамматической машины

Фактически существует две ортогональные линейки версий словаря: Pro и Free. Эти версии имеют разный бинарный формат файлов, поэтому для работы со словарем версии Pro необходимы соответствующим образом скомпилированные утилиты. Версии Premium добавляют к Pro расширенный тезаурус.

В словарь могут включаться разные лексиконы, например только русский, или только французский, или даже смесь русский+японский. Состав тезауруса также определяется вариантом сборки словаря, например русско-японский словарь включает соответствующие переводы.

Таким образом, сочетание всех вышеперечисленных факторов дает большое количество сочетаний, из которых только несколько используется в проекте. Скрипты для сборки соответствующих версий словаря находятся в каталоге \scripts\dictionary.

Версии для разных платформ

Словари, собранные для поддерживаемых платформ, несовместими между собой из-за низкоуровневых различий, к которым относятся размер некоторых встроенных типов данных языка C.

Поэтому версии словаря для Windows x64 и Linux x86_64 несовместимы, также как и версии для Windows x86 и Windows x64.

Таким образом, в отличие от описания словаря в исходных текстах, полностью кроссплатформенного, собранный словарь нельзя использовать на другой платформе.

Тезаурус

Тезаурус, или база связей между словарными статьями и словосочетаниями, функционирует только в версии Pro. С помощью тезауруса выполняются некоторые грамматические операции, например приведение к грамматически связанной форме существительного (играть-игра) - см. процедуру sol_TranslateToNoun, к форме инфинитива (игравший-играть) - см. процедуру sol_TranslateToInfinitive, учет синонимов - см. команду -links=@synonyms. Уникальная для поисковых систем операция - поиск с автоматическим переводом, также реализуется посредством тезауруса.

Синтаксический анализатор

Синтаксический анализатор также включается только в словарь версии Pro, прежде всего по причине большого размера.

База N-грамм

Эта часть словаря формируется полностью автоматически программой Empirika из набора текстовых файлов.

  © Elijah Koziev 2010
прикладные проекты на основе грамматического словаря API грамматической машины компоненты для доступа к грамматическому словарю условия получения SDK токенизатор и сегментатор морфологический анализ и синтез лемматизатор база N-грамм синтаксический анализатор словоформы морфология и синтаксис русского языка падеж число род совершенный и несовершенный вид экспорт в SQL формат экспорт в XML формат скрипт SQL словаря структура SQL словаря структура XML словаря компоненты для доступа к грамматическому словарю ORM Persistent Dictionary Library лемматизация стемминг примеры использования грамматического словаря склонение существительных в русском языке склонение русских прилагательных спряжение глаголов в русском языке поиск текста с учетом морфологии OCR подсистема расширенные регулярные выражения генератор текста генератор случайного текста и имитатор рандомизатор синонимизатор перефразировщик Статистика буквенных паттернов

Грамматический словарь русского языка



Грамматический словарь
склонение и спряжение глаголов, существительных, прилагательных

В состав входит русский и английский словарь.

платформа:  Windows 2000 ... Windows 7
требования: 512 Mb свободной памяти, 300 Мб на диске
размер:         34 Мб

  скачать грамматический словарь купить грамматический словарь SDK грамматического словаря
грамматический словарь русского языка



SDK Грамматического словаря



SDK Грамматического Словаря
склонение и спряжение глаголов, существительных, прилагательных

В состав входит русский и английский словарь.

платформа:  Windows 2000 ... Windows 7
размер:         13 Мб

SQL словарь (демо):
sqlite mysql oracle firebird mssql

скачать демо-версию SDK купить SDK API грамматического словаря



Поисковая система



Integra
настольная и сетевая поисковая система 

платформа:  Windows XP ... Windows 7
требования: 512 Mb свободной памяти
размер:         21 Мб

Дополнительные компоненты:
MySQL поисковый сервер 13.5 Мб
Integra.Premium MySQL 3.9 Мб

скачать поисковую систему SDK поисковой системыописание поисковой системы



SDK Поисковой системы



SDK Поискового движка
API для настольной и сетевой поисковая система 

платформа:  Windows XP ... Windows 7
размер:         17 Мб

Дополнительные компоненты:

MySQL поисковый сервер 13.5 Мб
Integra.Premium MySQL 3.9 Мб

скачать SDK SDK поисковой системы



Экранный переводчик



Translator
экранный переводчик

платформа:  Windows XP ... Windows 7
требования: 256 Mb свободной памяти
размер:         4.4 Мб

Дополнительные компоненты:
расширенный англо-русский словарь 6.4 Мб


скачать экранный переводчикописание экранного переводчика



последние изменения 16-Oct-10