Русская и английская морфология для Windows и Linux

Состав SDK грамматического словаря

В состав текущей версии SDK грамматического словаря входят:

 Русский морфологический словарь - лексикон и тезаурус, более 205 тысяч словарных статей, десятки тысяч синонимов, антонимов, гипернимов и гипонимов, однокоренных слов и так далее. Вместо русской словарной базы можно выбрать вариант SDK с английским словарем - см. далее.

 Английский морфологический словарь, включающий около 210 тысяч словарных статей.

 Токенизатор и сегментатор текста (подробнее ).

 Модуль морфологического разбора слов и предложений (подробнее ), для русского или английского языка соответственно.

 Модуль синтаксического разбора предложения (подробнее ), для русского или английского языка соответственно.

 Скомпилированная dll/so для доступа к базе грамматического словаря для выбранной x32 или x64 платформы Windows или Linux, и .NET обертка для Win 32/64 DLL, имеющие большой набор функций для выполнения склонения, спряжения, проверки согласования, определения морфологических атрибутов слова, и так далее.

 Скомпилированная dll и so лемматизатора для Windows 32/64 и .NET с примерами на C++, стеммер и библиотека поиска ключевых слов с морфологией для .NET с примерами

 Компилятор словаря, скрипт для расширения базового русского словарного модуля, учебный анализатор русских предложений в виде исходников и скрипта пересборки анализатора.

 Утилиты для Windows и Linux: lexicon, syntax, empirika

 Утилиты для Windows debugger (только 32 бита), LexiconEditor, Thesaurus

 Примеры использования на C++, C#, Delphi.

Обратите внимание, что в SDK грамматического словаря не входит генератор текста и перефразировщик.

Варианты SDK для Windows и Linux поставляются как отдельные программные продукты. Английский и русский варианты словарной базы и анализаторов также являются отдельными программными продуктами. Читайте также пополняемый список ответов на частые вопросы.

Перейти к детальному описанию API грамматического движка .

Ознакомительная версия SDK грамматического словаря

Ознакомительная версия SDK включает немного урезанный вариант лексикона и тезауруса, но в остальном не отличается от полной коммерческой версии.

Вы можете скачать ознакомительную версию SDK под нужную платформу:

Скачать русскую морфологию для Windows 32 бита (20 Мб)

Скачать русскую морфологию для Linux 32 бита (31 Мб)

Скачать русскую морфологию для Linux 64 бита (31 Мб)

Ознакомительная версия грамматического словаря может быть использована в любых коммерческих приложениях при условии указания ссылки на данный ресурс.

Эта версия практически идентична полному дистрибутиву, за исключением нескольких функциональных и количественных ограничений. В частности, в ней урезан русский тезаурус и лексикон, то есть уменьшено количество словарных статей, синонимов и других связей. Также в ней отсутствуют средства для пополнения лексикона. Синтаксический анализатор не отличается от коммерческой версии. Попробовать его в работе можно с помощью тестовых предложений.

В ознакомительный SDK входит упрощенный английский словарный модуль. Для его подключения достаточно скопировать содержимое каталога bin-windows-english в bin-windows после установки или распаковки дистрибутива. Настройка всех утилит на работу с английскими словами и предложениями произойдет автоматически. Для проверки можно взять любое из тестовых предложений.

Процедуры морфологического разбора и синтаксического анализа предложений в ознакомительном варианте SDK ничем не отличаются от коммерческой версии SDK. В состав дистрибутива входят утилиты Lexicon и Syntax, а также программа Debugger, позволяющие проверить процесс морфологического и синтаксического разбора в интерактивном режиме. Кроме того, входящий в SDK грамматического словаря компонент solarix_grammar_engine.dll (или solarix_grammar_engine.so для Linux) дает возможность удобного вызова функций API из прикладного кода на C, C++ и Delphi.

После установки или распаковки архива в подкаталоге ...\demo\ai\solarix\Grammar_Engine можно найти несколько примеров вызова процедур API из программ на C++, C# и Delphi.

В качестве демонстрации функциональных возможностей можно также взять бесплатную программу морфологического разбора слов и предложений.

Отдельно доступна условно-бесплатная программа Грамматический Словарь Русского Языка, которая предоставляет простой и удобный доступ к русскому и английскому лексикону и тезаурусу с удобной навигацией в стиле веб-браузера.

Установка и использование компонентов грамматического словаря

Для морфологического словаря под Windows необходимо запустить сначала основной инсталлятор и затем инсталлятор выбранного языка. Они установят компоненты и все остальные файлы в выбранный каталог, по умолчанию это будет c:\Program Files\RussianGrammaticalDictionary. После этого можно перейти в подкаталог demo\ai\solarix\Grammar_Engine\Lexicon и ознакомиться с примером использования solarix_grammar_dictionary.dll.

Для Linux-версии морфологического словаря необходимо распаковать архив, перейти в подкаталог .../scripts/build и вызвать в консоли команды: su, ./install.sh и exit. Динамические библиотеки будут скопированы в соответствующий каталог, после чего можно, к примеру, перейти в подкаталог .../demo/ai/solarix/Grammar_Engine/Lemmatizator/C и ознакомиться с демонстрацией работы русского лемматизатора. В каталоге .../demo/ai/solarix/Grammar_Engine/LexiconLinux можно найти пример работы на C с морфологическим анализатором русского языка.

Для проверки работоспособности русского словаря необходимо открыть консоль в каталоге ...\scripts\syntax, и запустить скрипты тестирования lemmatizer-ru.cmd, morphology-ru.cmd и syntax-ru.cmd. Они содержат протестируют лемматизатор, морфологический и синтаксический анализатор.

Проверка английского словаря заключается в запуске скриптов morphology-en.cmd и syntax-en.cmd в том же каталоге.

Серверный вариант грамматического словаря

Некоторые технические ограничения, накладываемые локальным бинарным словарем из данного продукта, могут быть преодолены переходом на серверный вариант. В серверном варианте словарь полностью размещается в реляционной СУБД, а исполнимые модули, включая dll движка, работают как клиенты БД.

При этом процедурный API в серверном варианте полностью идентичен "локальной" версии. Благодаря этому программы, работающие с грамматическим словарем через API, не нуждаются в переработке и даже пересборке. Достаточно заменить solarix_grammar_engine.dll на solarix_grammar_engine_mysql.dll и при создании экземпляра словаря указать на измененный конфигурационный файл dictionary.xml

Детальные характеристики серверного варианта доступны на странице продукта.

English >>

  © Elijah Koziev 2010
прикладные проекты на основе грамматического словаря API грамматической машины компоненты для доступа к грамматическому словарю условия получения SDK токенизатор и сегментатор морфологический анализ и синтез лемматизатор база N-грамм синтаксический анализатор словоформы морфология и синтаксис русского языка падеж число род совершенный и несовершенный вид экспорт в SQL формат экспорт в XML формат скрипт SQL словаря структура SQL словаря структура XML словаря компоненты для доступа к грамматическому словарю ORM Persistent Dictionary Library лемматизация стемминг примеры использования грамматического словаря склонение существительных в русском языке склонение русских прилагательных спряжение глаголов в русском языке поиск текста с учетом морфологии OCR подсистема расширенные регулярные выражения генератор текста генератор случайного текста и имитатор рандомизатор синонимизатор перефразировщик Статистика буквенных паттернов

Грамматический словарь русского языка



Грамматический словарь
склонение и спряжение глаголов, существительных, прилагательных

В состав входит русский и английский словарь.

платформа:  Windows 2000 ... Windows 7
требования: 512 Mb свободной памяти, 300 Мб на диске
размер:         34 Мб

  скачать грамматический словарь купить грамматический словарь SDK грамматического словаря
грамматический словарь русского языка



SDK Грамматического словаря



SDK Грамматического Словаря
склонение и спряжение глаголов, существительных, прилагательных

В состав входит русский и английский словарь.

платформа:  Windows 2000 ... Windows 7
размер:         13 Мб

SQL словарь (демо):
sqlite mysql oracle firebird mssql

скачать демо-версию SDK купить SDK API грамматического словаря



Поисковая система



Integra
настольная и сетевая поисковая система 

платформа:  Windows XP ... Windows 7
требования: 512 Mb свободной памяти
размер:         21 Мб

Дополнительные компоненты:
MySQL поисковый сервер 13.5 Мб
Integra.Premium MySQL 3.9 Мб

скачать поисковую систему SDK поисковой системыописание поисковой системы



SDK Поисковой системы



SDK Поискового движка
API для настольной и сетевой поисковая система 

платформа:  Windows XP ... Windows 7
размер:         17 Мб

Дополнительные компоненты:

MySQL поисковый сервер 13.5 Мб
Integra.Premium MySQL 3.9 Мб

скачать SDK SDK поисковой системы



Экранный переводчик



Translator
экранный переводчик

платформа:  Windows XP ... Windows 7
требования: 256 Mb свободной памяти
размер:         4.4 Мб

Дополнительные компоненты:
расширенный англо-русский словарь 6.4 Мб


скачать экранный переводчикописание экранного переводчика



изменено 15-Mar-16