Работа с грамматическим словарем в формате SQL

Среди поддерживаемых вариантов СУБД самым простым для развертывания с нуля является, конечно, SQLite, так как этот движок не требует установки серверной части и доступен на большом количестве платформ.

1. Берем архив демо-версии dictionary-demo-sqlite.rar (примерно 4 Мб), распаковываем его.

2. Формируем с помощью полученных на шаге 1 скриптов словарную базу данных SQLite. Удобнее всего это сделать с помощью утилиты sqlite3.exe, которая есть на сайте sqlite.org. В консоли командная строка будет примерно такая:

sqlite3.exe dictionary.sqlite < dictionary.sql

Она сформирует базу данных в файле dictionary.sqlite

3. Теперь берем бесплатную программу для просмотра БД SQLite Database Browser, открываем в ней созданный файл БД грамматического словаря и видим набор таблиц, значение которых подробно описано здесь.

таблицы грамматического словаря

Можно посмотреть содержимое таблицы sg_entry - это шапки словарных статей:

word entries

На отдельной вкладке есть возможность написать запрос к базе данных и получить результаты его выполнения. Например, такой запрос:

select F.name, S.name
from sg_entry E, sg_form F, sg_form_coord FC, sg_coord C, sg_state S
where E.name='кошка' and
F.id_entry=E.id and
FC.id_entry=E.id and FC.iform=F.iform and
C.name='ПАДЕЖ' and
FC.icoord=C.id and
S.id_coord=C.id and S.id=FC.istate

выдаст падежные формы существительного кошка:

падежи существительного

Намного более подробно работа с SQL словарем и решение типичных задач рассмотрены в серии уроков и справочных страниц:

Поиск слов в словарной базе.

Определение части речи.

Поиск и восстановление слов с буквой ё.

Получение грамматических форм слова.

Получение гистограммы распределения слов по частям речи

Процесс загрузки SQL словаря.

Детальное описание реляционной схемы грамматического словаря.

Дополнительные материалы

Дистрибутив SQL словаря

Экспорт словаря из бинарного формата в SQL

Редактор Словаря SQLex

Экспорт словаря из SQL БД в текстовый формат

ORM Persistent Dictionary Library

  © Козиев Илья 2019
изменено 04-May-12