Спецификации грамматического словаря

Файлы описания грамматики

Исходным представлением словаря являются текстовые файлы с формализованными объявлениями структурных единиц - словарных и фразовых статей, связей тезауруса, правил морфологического анализа и так далее.

Текстовый формат описания словаря дает несколько преимуществ по сравнению с другими способами формирования словаря, например напрямую в SQL БД, или через функции модификации словаря в процедурном API или ORM библиотеке.

Можно использовать системы контроля версий для коллективной правки словаря.

Поиск и замена, а также другие операции с текстом, могут выполняется любыми удобными для пользователя средствами, в том числе unix-утилитами.

Можно вносить правки с помощью самого простого текстового редактора.

Нет необходимости поддерживать кроссплатформенный специализированный редактор словаря. Во многих случаях оказывается удобным создавать специализированные редакторы, например в виде ASP.NET кода для клиент-серверной архитектуры, или на Delphi.

Можно расширять форматы описания грамматики за счет собственного DSL (domain-specific language), преобразуя их в базовые описания утилитами на любом удобном языке программирования. Если средств встроенного C-подобного препроцессора недостаточно, то можно написать на Java или C# утилиту и разработать свой набор спецификаций.

Простота создания резервных копий и восстановления отдельных частей словаря.

Преобразование в двоичное представление

Грамматический процессор по соображениям эффективности работает в бинарным представлением грамматики. Для преобразования текстовых спецификаций в требуемое двоичное представление используется компилятор словаря и вспомогательная утилита ThesaurusNotes.

Декомпиляция

С некоторыми ограничениями возможно выполнить обратное преобразование из бинарного представления в текстовый формат.

Для словаря, хранящегося в бинарных файлах, этот процесс использует внутреннее объектно-реляционное представление грамматики. Декомпиляция выполняется утилитой decompiler.

В случае использования SQL хранилища декомпиляция основывается на строгой реляционной структуре, однозначно соответствующей текстовым спецификациям. Утилита sql2sol подключается к базе данных и выгружает ее содержимое в набор текстовых файлов со спецификациями грамматики.

  © Elijah Koziev 2010
прикладные проекты на основе грамматического словаря API грамматической машины компоненты для доступа к грамматическому словарю условия получения SDK токенизатор и сегментатор морфологический анализ и синтез лемматизатор база N-грамм синтаксический анализатор словоформы морфология и синтаксис русского языка падеж число род совершенный и несовершенный вид экспорт в SQL формат экспорт в XML формат скрипт SQL словаря структура SQL словаря структура XML словаря компоненты для доступа к грамматическому словарю ORM Persistent Dictionary Library лемматизация стемминг примеры использования грамматического словаря склонение существительных в русском языке склонение русских прилагательных спряжение глаголов в русском языке поиск текста с учетом морфологии OCR подсистема расширенные регулярные выражения генератор текста генератор случайного текста и имитатор рандомизатор синонимизатор перефразировщик Статистика буквенных паттернов

Грамматический словарь русского языка



Грамматический словарь
склонение и спряжение глаголов, существительных, прилагательных

В состав входит русский и английский словарь.

платформа:  Windows 2000 ... Windows 7
требования: 512 Mb свободной памяти, 300 Мб на диске
размер:         34 Мб

  скачать грамматический словарь купить грамматический словарь SDK грамматического словаря
грамматический словарь русского языка



SDK Грамматического словаря



SDK Грамматического Словаря
склонение и спряжение глаголов, существительных, прилагательных

В состав входит русский и английский словарь.

платформа:  Windows 2000 ... Windows 7
размер:         13 Мб

SQL словарь (демо):
sqlite mysql oracle firebird mssql

скачать демо-версию SDK купить SDK API грамматического словаря



Поисковая система



Integra
настольная и сетевая поисковая система 

платформа:  Windows XP ... Windows 7
требования: 512 Mb свободной памяти
размер:         21 Мб

Дополнительные компоненты:
MySQL поисковый сервер 13.5 Мб
Integra.Premium MySQL 3.9 Мб

скачать поисковую систему SDK поисковой системыописание поисковой системы



SDK Поисковой системы



SDK Поискового движка
API для настольной и сетевой поисковая система 

платформа:  Windows XP ... Windows 7
размер:         17 Мб

Дополнительные компоненты:

MySQL поисковый сервер 13.5 Мб
Integra.Premium MySQL 3.9 Мб

скачать SDK SDK поисковой системы



Экранный переводчик



Translator
экранный переводчик

платформа:  Windows XP ... Windows 7
требования: 256 Mb свободной памяти
размер:         4.4 Мб

Дополнительные компоненты:
расширенный англо-русский словарь 6.4 Мб


скачать экранный переводчикописание экранного переводчика



изменено 05-Feb-12