Язык описания грамматического словаря

Виртуальный грамматический процессор

Правила трансформации текста на внутреннем языке (см. описание далее) компилируются во внутреннее представление, которое исполняется виртуальным процессором.

Реализация виртуального процессора написана полностью на языке C++. Основные операции - работа с лексемами, деревьями, информацией в лексиконе, тезаурусе, базе N-грамм.

Внутренний язык, и следовательно грамматический процессор, практически не содержат средств ввода-вывода. Получение вербальной (текстовой) информации от пользователя и выдача ему результатов полностью ложатся на прикладной код. Например, некоторые утилиты работают в текстовой консоли - см. Syntax и Synonymizer, и позволяют пользователю вводить фразы и видеть на экране результаты их трансформации. Есть также API, позволяющий прикладным программам вызывать преобразование текста - см. к примеру Rewriter, который выполняет пакетную обработку текстовых файлов. Программа Transformer работает как веб-сервер, получающий запросы и возвращающий результаты преобразования текста (перевода) по протоколу HTTP.

Описание языка

Общие соображения

Препроцессор

Компилятор словаря

Пространства имен

Кванторы

Словарь

Грамматики:
                    Алфавит
                    Лексикон
                    Фонетика

Грамматические координаты (перечисления)

Грамматические классы

Словарные статьи

Модули:

             Сегментатор и токенизатор
                   Морфологический анализатор
                   Синтаксический анализатор
                   Фонетический анализатор
                   СУБД Пролог-автомат

Продукционные правила и итераторы

Трансформация текста

Тезаурус и N-граммы
     Словоформы

Внутреннее представление грамматической информации

Компилятор словаря получает на входе набор текстовых файлов с формализованными объявлениями словарных и фразовых статей, связей тезауруса, правил анализа и синтеза. Текстовые объявления преобразуются компилятором в бинарное представление, с которым работает виртуальный грамматический процессор. Бинарное представление словаря может хранится разными способами, к примеру в реляционной базе данных или в локальных двоичных файлах. Виртуальный грамматический процессор работает с бинарным представлением словаря через слои абстракции хранилища, что позволяет использовать один и тот же исполняющий код процессора в разных конфигурациях, например со словарем в MySQL или в локальном бинарном файле.

  © Elijah Koziev 2010
прикладные проекты на основе грамматического словаря API грамматической машины компоненты для доступа к грамматическому словарю условия получения SDK токенизатор и сегментатор морфологический анализ и синтез лемматизатор база N-грамм синтаксический анализатор словоформы морфология и синтаксис русского языка падеж число род совершенный и несовершенный вид экспорт в SQL формат экспорт в XML формат скрипт SQL словаря структура SQL словаря структура XML словаря компоненты для доступа к грамматическому словарю ORM Persistent Dictionary Library лемматизация стемминг примеры использования грамматического словаря склонение существительных в русском языке склонение русских прилагательных спряжение глаголов в русском языке поиск текста с учетом морфологии OCR подсистема расширенные регулярные выражения генератор текста генератор случайного текста и имитатор рандомизатор синонимизатор перефразировщик Статистика буквенных паттернов

Грамматический словарь русского языка



Грамматический словарь
склонение и спряжение глаголов, существительных, прилагательных

В состав входит русский и английский словарь.

платформа:  Windows 2000 ... Windows 7
требования: 512 Mb свободной памяти, 300 Мб на диске
размер:         34 Мб

  скачать грамматический словарь купить грамматический словарь SDK грамматического словаря
грамматический словарь русского языка



SDK Грамматического словаря



SDK Грамматического Словаря
склонение и спряжение глаголов, существительных, прилагательных

В состав входит русский и английский словарь.

платформа:  Windows 2000 ... Windows 7
размер:         13 Мб

SQL словарь (демо):
sqlite mysql oracle firebird mssql

скачать демо-версию SDK купить SDK API грамматического словаря



Поисковая система



Integra
настольная и сетевая поисковая система 

платформа:  Windows XP ... Windows 7
требования: 512 Mb свободной памяти
размер:         21 Мб

Дополнительные компоненты:
MySQL поисковый сервер 13.5 Мб
Integra.Premium MySQL 3.9 Мб

скачать поисковую систему SDK поисковой системыописание поисковой системы



SDK Поисковой системы



SDK Поискового движка
API для настольной и сетевой поисковая система 

платформа:  Windows XP ... Windows 7
размер:         17 Мб

Дополнительные компоненты:

MySQL поисковый сервер 13.5 Мб
Integra.Premium MySQL 3.9 Мб

скачать SDK SDK поисковой системы



Экранный переводчик



Translator
экранный переводчик

платформа:  Windows XP ... Windows 7
требования: 256 Mb свободной памяти
размер:         4.4 Мб

Дополнительные компоненты:
расширенный англо-русский словарь 6.4 Мб


скачать экранный переводчикописание экранного переводчика



изменено 05-Feb-12