Представление грамматического числа в словаре

Грамматическое число в русском языке

Грамматическое число - это одна из двух словоизменительных категорий русского имени существительного, наряду с падежом. Она выражает противопоставление единичности и множественности предметов и явлений.

Число также входит в парадигму некоторых других частей речи, в том числе прилагательных, местоимений, глаголов.

Во всех случаях грамматическое число является словоизменительной категорией, в отличие, например, от падежа. Падеж для предлогов, глаголов, деепричастий не выделяет отдельные грамматические формы, а описывает синтаксические свойства словарной статьи в целом - а именно определяет сочетаемость с существительными и местоимениями в соответствующем падеже. Самая сложная ситуация - у причастий. Как и прилагательные, они склоняются по падежам. От глаголов они наследуют свойство падежной валентности.

На уровне описания словаря это означает, что грамматическое число всегда является координатой-измерением.

С помощью программы Грамматический Словарь или веб-формы на странице онлайн-демо можно увидеть грамматические формы множественного числа для существительного:

множественное число существительного

для прилагательного, аналогично - для причастия:

множественное число прилагательного

для глагола:

множественное число в глагольных формах

Не все существительные имеют формы единственного или множественного числа. В некоторых случаях множественное число отсутствует - для обозначения таких существительных используется латинский термин singularia tantum. Сюда относятся такие существительные, как кино или железо:

singularia tantum

В редких случаях отсутствует множественное число, такие для таких существительных используется латинский термин pluralia tantum. Примеры - джунгли, щи:

pluralia tantum

При использовании процедурного API грамматическое число представлено константой NOUN_ru, а два состояния соответственно SINGULAR_NUMBER_ru и PLURAL_NUMBER_ru для единственного и множественного числа.

Множественное число в английском языке

Английские существительные, как и русские, изменяются по числам. Для подавляющего большинства существительных образование множественного числа осуществляется просто присоединением окончания -s, либо -es, либо -ies:

множественное число существительного

На иллюстрации показано, как утилита Lexicon, входящая в SDK Грамматического Словаря, выполняет морфологический разбор слова cats.

Количество отклонений от регулярного способа получения множественного числа очень немного. Можно выделить такие случаи.

Множественное число вообще отсутствует - как у существительных information, news.

Есть более чем одна форма множественного числа - как у существительного penny - pennies и pence.

Формы единственного и множественного числа совпадают - как у deer или sheep.

Некоторые существительные не имеют формы единственного числа - например, people.

Наконец, самая большая группа исключений - это существительные, образующие множественно число изменением корня: tooth-teeth.

При работе с грамматическим словарем все вышеописанные нерегулярности не имеют значения для процедуры морфологического разбора. Все нужные правила образования форм существительных уже описаны в лексиконе.

Для программного определения числа английского существительного следует обратить внимание, что несмотря на похожесть, число в русском языке и число в английском - это разные грамматические признаки. Соответственно, они имеют разные названия и разные целочисленные значения при обращениях к API. Для английского языка грамматическое число называется NUMBER, формы единственного и множественного числа - SINGLE и PLURAL.

Определение числа английского существительного в процедурном API

Рассмотрим, как можно узнать число для английского существительного с помощью функций API. Так как в английском языке из-за особенностей грамматики отличить существительное от глагола или прилагательного вне контекста бывает затруднительно, то будем считать, что мы априори получили форму существительного. Сначала выполняем морфологический анализ слова с помощью процедуры sol_ProjectWord. Она в общем случае вернет список вариантов морфологического анализа. Чтобы определить значение числа для одного из вариантов, можно воспользоваться процедурой sol_GetProjCoordState. На языке C++ это выглядит примерно так:

     HGREN_WCOORD hProj = sol_ProjectWord( hEngine, L"CATS", false );
     int nproj = sol_CountProjection( hProj );
     ...
     int noun_number = sol_GetProjCoordState( hEngine, hProj, 0, NUMBER_xx );

В данном случае NUMBER_xx - это целочисленная константа, объявленная в файле _sg_api.h, соответствующая грамматическому числу для английского языка.

Полученное в переменной noun_number число может быть либо -1, если признака числа в первой проекции нет, либо SINGLE_xx для единственного числа, либо PLURAL_xx для множественного.

Дополнительная информация по существительным, глаголам и прилагательным

Род существительных

Падежи

Склонение существительных в русском языке

Спряжение глаголов в русском языке

Склонение прилагательных в русском языке


Особенности описания русских существительных

Особенности описания английских существительных


Грамматические категории в морфологическом словаре

Морфология русского языка

Особенности согласования прилагательных и существительных


  © Elijah Koziev 2010
прикладные проекты на основе грамматического словаря API грамматической машины компоненты для доступа к грамматическому словарю условия получения SDK токенизатор и сегментатор морфологический анализ и синтез лемматизатор база N-грамм синтаксический анализатор словоформы морфология и синтаксис русского языка падеж число род совершенный и несовершенный вид экспорт в SQL формат экспорт в XML формат скрипт SQL словаря структура SQL словаря структура XML словаря компоненты для доступа к грамматическому словарю ORM Persistent Dictionary Library лемматизация стемминг примеры использования грамматического словаря склонение существительных в русском языке склонение русских прилагательных спряжение глаголов в русском языке поиск текста с учетом морфологии OCR подсистема расширенные регулярные выражения генератор текста генератор случайного текста и имитатор рандомизатор синонимизатор перефразировщик Статистика буквенных паттернов

Грамматический словарь русского языка



Грамматический словарь
склонение и спряжение глаголов, существительных, прилагательных

В состав входит русский и английский словарь.

платформа:  Windows 2000 ... Windows 7
требования: 512 Mb свободной памяти, 300 Мб на диске
размер:         34 Мб

  скачать грамматический словарь купить грамматический словарь SDK грамматического словаря
грамматический словарь русского языка



SDK Грамматического словаря



SDK Грамматического Словаря
склонение и спряжение глаголов, существительных, прилагательных

В состав входит русский и английский словарь.

платформа:  Windows 2000 ... Windows 7
размер:         13 Мб

SQL словарь (демо):
sqlite mysql oracle firebird mssql

скачать демо-версию SDK купить SDK API грамматического словаря



Поисковая система



Integra
настольная и сетевая поисковая система 

платформа:  Windows XP ... Windows 7
требования: 512 Mb свободной памяти
размер:         21 Мб

Дополнительные компоненты:
MySQL поисковый сервер 13.5 Мб
Integra.Premium MySQL 3.9 Мб

скачать поисковую систему SDK поисковой системыописание поисковой системы



SDK Поисковой системы



SDK Поискового движка
API для настольной и сетевой поисковая система 

платформа:  Windows XP ... Windows 7
размер:         17 Мб

Дополнительные компоненты:

MySQL поисковый сервер 13.5 Мб
Integra.Premium MySQL 3.9 Мб

скачать SDK SDK поисковой системы



Экранный переводчик



Translator
экранный переводчик

платформа:  Windows XP ... Windows 7
требования: 256 Mb свободной памяти
размер:         4.4 Мб

Дополнительные компоненты:
расширенный англо-русский словарь 6.4 Мб


скачать экранный переводчикописание экранного переводчика



изменено 18-Jun-12