Русская и английская морфология для Windows и Linux

Состав SDK грамматического словаря

В состав текущей версии SDK грамматического словаря входят:

 Русский морфологический словарь - лексикон и тезаурус, более 205 тысяч словарных статей, десятки тысяч синонимов, антонимов, гипернимов и гипонимов, однокоренных слов и так далее. Вместо русской словарной базы можно выбрать вариант SDK с английским словарем - см. далее.

 Английский морфологический словарь, включающий около 210 тысяч словарных статей.

 Токенизатор и сегментатор текста (подробнее ).

 Модуль морфологического разбора слов и предложений (подробнее ), для русского или английского языка соответственно.

 Модуль синтаксического разбора предложения (подробнее ), для русского или английского языка соответственно.

 Скомпилированная dll/so для доступа к базе грамматического словаря для выбранной x32 или x64 платформы Windows или Linux, и .NET обертка для Win 32/64 DLL, имеющие большой набор функций для выполнения склонения, спряжения, проверки согласования, определения морфологических атрибутов слова, и так далее.

 Скомпилированная dll и so лемматизатора для Windows 32/64 и .NET с примерами на C++, стеммер и библиотека поиска ключевых слов с морфологией для .NET с примерами

 Компилятор словаря, скрипт для расширения базового русского словарного модуля, учебный анализатор русских предложений в виде исходников и скрипта пересборки анализатора.

 Утилиты для Windows и Linux: lexicon, syntax, empirika

 Утилиты для Windows debugger (только 32 бита), LexiconEditor, Thesaurus

 Примеры использования на C++, C#, Delphi.

Обратите внимание, что в SDK грамматического словаря не входит генератор текста и перефразировщик.

Варианты SDK для Windows и Linux поставляются как отдельные программные продукты. Английский и русский варианты словарной базы и анализаторов также являются отдельными программными продуктами. Читайте также пополняемый список ответов на частые вопросы.

Перейти к детальному описанию API грамматического движка .

Исходные тексты

Исходные тексты Грамматического Словаря и данные для сборки словарной базы доступны для свободного использования в репозитории проекта.

Дистрибутивная версия SDK грамматического словаря

Дистрибутивная версия SDK включает немного урезанный вариант лексикона и тезауруса. Также в состав дистрибутива входят готовые языковые модели для лемматизации, частеречной разметки и синтаксического анализа, полученные с помощью различных методов машинного обучения.

Вы можете скачать дистрибутив SDK под нужную платформу:

Скачать русскую морфологию для Windows 32 бита (20 Мб)

Скачать русскую морфологию для Linux 32 бита (31 Мб)

Скачать русскую морфологию для Linux 64 бита (31 Мб)

Данная версия грамматического словаря может быть использована в любых коммерческих приложениях при условии указания ссылки на данный ресурс.

После установки или распаковки архива в подкаталоге ...\demo\ai\solarix\Grammar_Engine можно найти несколько примеров вызова процедур API из программ на C++, C# и Delphi.

В качестве демонстрации функциональных возможностей можно также взять бесплатную программу морфологического разбора слов и предложений.

Отдельно доступна условно-бесплатная программа Грамматический Словарь Русского Языка, которая предоставляет простой и удобный доступ к русскому и английскому лексикону и тезаурусу с удобной навигацией в стиле веб-браузера.

Установка и использование компонентов грамматического словаря

Для морфологического словаря под Windows необходимо запустить сначала основной инсталлятор и затем инсталлятор выбранного языка. Они установят компоненты и все остальные файлы в выбранный каталог, по умолчанию это будет c:\Program Files\RussianGrammaticalDictionary. После этого можно перейти в подкаталог demo\ai\solarix\Grammar_Engine\Lexicon и ознакомиться с примером использования solarix_grammar_dictionary.dll.

Для Linux-версии морфологического словаря необходимо распаковать архив, перейти в подкаталог .../scripts/build и вызвать в консоли команды: su, ./install.sh и exit. Динамические библиотеки будут скопированы в соответствующий каталог, после чего можно, к примеру, перейти в подкаталог .../demo/ai/solarix/Grammar_Engine/Lemmatizator/C и ознакомиться с демонстрацией работы русского лемматизатора. В каталоге .../demo/ai/solarix/Grammar_Engine/LexiconLinux можно найти пример работы на C с морфологическим анализатором русского языка.

Для проверки работоспособности русского словаря необходимо открыть консоль в каталоге ...\scripts\syntax, и запустить скрипты тестирования lemmatizer-ru.cmd, morphology-ru.cmd и syntax-ru.cmd. Они содержат протестируют лемматизатор, морфологический и синтаксический анализатор.

Проверка английского словаря заключается в запуске скриптов morphology-en.cmd и syntax-en.cmd в том же каталоге.

English >>

  © Козиев Илья 2019
изменено 25-Feb-18