Отладчик грамматического словаря

Инструменты для проверки работы грамматического движка

Грамматическая машина это набор алгоритмов для выполнения морфологического и синтаксического анализа и синтеза слов и предложений. Так как описание правил выполнения элементарных операций осуществляется через отдельно компилируемый и загружаемый словарь, то возникает задача удобной отладки этих правил не в среде стандартных отладчиков компиляторов C++. К примеру, достаточно часто возникает задача: определить индексы словарной статьи и словоформы в этой статье, соответствующие какому-либо слову, так как внутри грамматической машины работа со словами выполняется исключительно через целочисленные индексы на словарные статьи (см. к примеру процедуру sol_GetNounForm).

В проекте есть несколько программ, которые работают как высокоуровневые отладчики грамматического движка - wdebugger,  lexicon и syntax.

WDEBUGGER - оконный отладчик для Словаря, входящий в SDK проекта. Он позволяет вводить предложения, выполнять их грамматический анализ и просматривать результаты полного синтаксического и лексического разбора.

Lexicon и syntax - это консольные программы, которые позволяют работать с морфологическим и синтаксическим анализаторами соответственно.

Для "оптовой" проверки работы грамматического движка можно использовать программу empirika - она выполняет различный, в том числе синтаксический анализ предложений в текстовых файлах и выдает по итогам работы статистические сведения.

Морфологический и синтаксический анализ

См. далее - примеры выполнения морфологического анализа отдельных слов и синтаксического анализа предложений.

  © Козиев Илья 2019
изменено 18-Sep-10