Редактор лексикона грамматического словаря

Реализация

Программа написана на C#, использует .NET-обертку грамматического движка.

Платформа - MS Windows + .NET

Позволяет вводить новые словарные статьи для русского лексикона и задавать связи для тезауруса.

Ее исходные тексты включены в дистрибутив SDK Грамматического Словаря.

редактор словаря

Технология расширения лексикона

Основное назначение утилиты - добавление в лексикон новых словарных статей. Исходным материалом обычно служит статистическая выдача программы Empirika, а именно список ненайденных в обработанном корпусе слов.

В отличие от редактора словаря SQLex, данная утилита работает с бинарным файлом словаря.

Утилита не меняет содержимое бинарного словаря. Вместо этого она позволяет формировать текстовый файл в формате спецификаций словарных статей и связей из вводимой пользователем в формах данных.

В результате работы программы в текущем каталоге появятся несколько текстовых файлов, содержимое которых надо скопировать в исходные тексты словаря.

_entries.sol - объявления словарных статей.

_links.sol - связи для тезауруса.

_deeprs.sol - список деепричастий, введенных на вкладках Несовершенный Глагол и Совершенный Глагол, которые программа не нашла в загруженном словаре, и которые надо добавить к списку деепричастий в исходниках словаря.

_infs.sol - список инфинитивов - неопределенных форм глаголов, которые программа не нашла в загруженном словаре и которые надо добавить к соответствующему списку в исходных текстах словаря. В полных исходниках словаря русские инфинитивы определены в файлах rus_infinitives_sov.sol и rus_infinitives_nesov.sol для совершенных и несовершенных глаголов соответственно.

Таким образом, пользователь самостоятельно добавляет к исходникам словаря новую информацию, после чего необходимо выполнить пересборку словаря.

Слова с частичной парадигмой

Некоторые словарные статьи имеют неполную парадигму - часть грамматических форм отсутствует. В таких случаях достаточно оставлять соответствующие поля на вкладке редактора пустой:

существительное с частичной парадигмой

Альтернативные грамматические формы

Некоторые слова в русском языке допускают альтернативные варианты для некоторых грамматических форм. Например, в ходе исторического развития языка, в результате унификации спряжения русских глаголов, то есть приведения спряжения по аналогии к общему образцу, у некоторых глаголов появляются одинаково допустимые формы

брызгаю-брызжу, полосаю-полощу

Чтобы вводить такие словарные статьи без последующего редактирования формируемого текстового файла, программа позволяют перечислять альтернативные формы через запятую в соответствующих полях:

спряжение глагола

Дополнительная информация

Словарные статьи

Тезаурус

Компилятор словаря

  © Козиев Илья 2019
изменено 18-Sep-10